12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
1/38
)
Provided by:
NAZWA
wget - nieinteraktywny program do pobierania z sieci
SKŁADNIA
wget [opcja]... [URL]...
OPIS
GNU Wget jest wolnym programem narzędziowym do pobierania plików z sieci.
protokoły HTTP, HTTPS i FTP, a także pobieranie poprzez serwery proxy HTT
Wget jest nieinteraktywny, co pozwala mu działać w tle, w czasie gdy użyt
zalogowany. Dzięki temu użytkownik może rozpocząć pobieranie i rozłączyć
pozwalając Wgetowi na zakończenie pracy. Większość przeglądarek WWW wymag
obecności człowieka, co staje się uciążliwe przy pobieraniu dużej ilości
Wget potrafi podążać za odnośnikami zawartymi w stronach HMTL, XHTML i CS
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
2/38
OPCJE
lokalne wersje zdalnych witryn, w pełni odtwarzając strukturę katalogów o
strony. Jest to czasami nazywane "pobieraniem rekurencyjnym". Podczas tak
Wget respektuje ustalenia Standardu Robot Exclusion (/robots.txt). Możliw
poinstruowanie programu, by w pobieranych plikach przekształcał odnośniki
wskazywały na lokalne kopie, do przeglądania bez połączenia.
Wget został zaprojektowany tak, by działać solidnie również przy powolnyc
niestabilnych połączeniach. Jeżeli pobieranie nie udaje się z powodu prob
ponawia próby aż do ściągnięcia całości pliku. Jeśli dany serwer obsługuj
Wget nakaże kontynuację pobierania od miejsca, w którym przerwano.
Składnia opcji
Wget używa GNU getopt do przetwarzania argumentów wiersza poleceń, więc k
długi i krótki format. Długie opcje są łatwiejsze do zapamiętania, lecz w
dłużej. Można dowolnie łączyć oba style zapisu lub podać opcje po argumen
poleceń. Można więc użyć:
wget -r --tries=10
-o log
Spacja pomiędzy opcją akceptującą argument i argumentem może być pomięta.
można wpisać -olog.
Można umieścić kilka opcji, które nie wymagają argumentów razem, tak jak
wget -drc <URL>
Jest to równoważne zapisowi:
wget -d -r -c <URL>
Ponieważ opcje mogą być podane po argumentach, może być konieczne oddziel
pomocą --. Poniższe polecenie spróbuje pobrać URL -x, zapisując niepowodz
wget -o log -- -x
Opcje, które akceptują listy oddzielone przecinkami, respektują konwencję
listy, która usuwa ich wartosć. Jest to przydatne do wyczyszczenia ustawi
jeśli .wgetrc użytkownika ustawia "exclude_directories" na /cgi-bin, to p
najpierw zresetuje wartość, a następnie ustawi ją na /~nobody i /~somebod
wyczyścić listę w .wgetrc.
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
3/38
wget -X " -X /~nobody,/~somebody
Większość opcji, która nie akceptuje argumentów są opcjami logicznymi tzn
stan można opisać zmienną zero-jedynkową ("logiczną"). Na przykład --foll
Wgetowi, aby podążał za linkami FTP z plików HTML, a --no-glob nakazuje n
rozwijania masek URL-i FTP. Opcje logiczną są albo pozytywne, albo negaty
się od --no). Wszystkie takie opcje mają kilka własności.
Jeżeli nie zaznaczono inaczej, to przyjmuje się, że domyślne zachowanie j
to, które zapewnia opcja. Na przykład udokumentowane istnienie --follow-f
domyślnie nie podąża się za linkami FTP ze stron HTML.
Działanie opcji pozytywnych można odwrócić dodając --no- do ich nazw; ana
przypadku opcji negatywnych (wyłączających) - usuwając przedrostek --no-.
na niepotrzebne -- skoro domyślnym działaniem opcji pozytywnych jest nie
to po co zapewniać metodę jawnego wyłączania ich? Wynika to z działania p
który może zmienić wartości domyślne. Przykładowo, skorzystanie z wpisu f
pliku .wgetrc powoduje, że Wget domyślnie podąża (follow) za dowiązaniami
opcja --no-follow-ftp jest jedynym sposobem na przywrócenie wartości pier
z wiersza poleceń.
Podstawowe opcje uruchamiania
-V
--version
Wyświetla wersję Wgeta.
-h
--help
Wypisuje komunikat pomocy, opisujący wszystkie opcje, jakie można prz
wierszu poleceń.
-b
--background
Przechodzi w tło natychmiast po rozpoczęciu pracy. Jeśli nie podano
za pomocą -o, wyjście jest przekierowywane do wget-log.
-e polecenie
--execute polecenie
Wykonuje polecenie tak, jakby było częścią .wgetrc. Polecenie wywołan
zostanie wykonane po poleceniach z .wgetrc, więc będzie mieć nad nimi
podać kilka poleceń wgetrc, należy użyć opcji -e wielokrotnie.
Opcje dziennika i pliku wejściowego
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
4/38
-o dziennik
--output-file=dziennik
Rejestruje wszystkie komunikaty w pliku dziennika. Normalnie są zgła
standardowym wyjściu błędów.
-a dziennik
--append-output=dziennik
Dodaje komunikaty na końcu pliku dziennika. Jest to to samo, co -o,
do dziennika zamiast nadpisywać stary. Jeśli plik dziennik nie istnie
tworzony.
-d
--debug
Włącza wyjście diagnostyczne, czyli wypisywanie rozmaitych informacji
twórców Wget, gdy nie działa on poprawnie. Administrator systemu mógł
bez obsługi trybu usuwania błędów, wówczas -d nie będzie działać. Na
kompilacja z obsługą diagnostyki jest zawsze bezpieczna -- Wget skomp
sposób nie będzie wypisywał żadnych informacji diagnostycznych dopóki
tego opcją -d.
-q
--quiet
Tryb cichy. Wyłącza wyjście Wget.
-v
--verbose
Pełne wyjście, z wszystkimi dostępnymi danymi. Jest to opcja domyślna
-nv
--non-verbose
Niepełne wyjście -- wyłącza pełne wyjście, ale nie ucisza całkowicie
opcją -q); komunikaty o błędach i podstawowe informacje będą nadal wy
--report-speed=typ
Wypisuje przepustowość jako typ. Jedyną akceptowaną wartością są bity
-i plik
--input-file=plik
Odczytuje URL-e z lokalnego lub zewnętrznego pliku. Jeśli jako plik p
są czytane ze standardowego wejścia (aby czytać z pliku nazwanego -,
zapisu ./-).
Czyta URL-e z pliku wejściowego plik, w związku z czym nie trzeba ich
wierszu poleceń. Jeśli URL-e podano zarówno w wierszu poleceń, jak i
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
5/38
wejściowym, to pierwsze zostaną pobrane pliki wymienione w wierszu po
podano opcji --force-html, to plik powinien składać się z zestawu URL
wiersz.
Jednakże jeśli zostanie podana opcja --force-html, to plik będzie tra
dokument html. Mogą się wówczas pojawić kłopoty z odnośnikami względ
rozwiązać dodając "<base href="url">" do pliku lub podając --base=url
poleceń.
Jeśli plik jest plikiem zewnętrznym, to dokument zostanie potraktowan
jako html, jeśli jego Content-Type pasuje do text/html. Co więcej, po
zostanie użyte jako href, jeśli nie podano innego.
-F
--force-html
Kiedy wejście jest czytane z pliku, wymusza aby było traktowane jako
Pozwala to na pobieranie względnych odnośników z istniejących plików
się na lokalnym dysku naszego komputera, przez dodanie znacznika "<ba
do pliku HTML lub użycie opcji --base.
-B URL
--base=URL
Przekształca linki względne używając URL-i jako punktu odniesienia, p
linków z pliku HTML określonego opcją -i/--input-file (razem z --forc
plik został pobrany z serwera zewnętrznego, opisującego go jako HTML)
odpowiednik obecności znacznika BASE w pliku wejściowym HTML, z warto
wartość atrybutu href.
do URL i odczytaniu pr
../baz/b.html z pliku wejściowego, zostanie on przekształcony do
--config=plik
Domyślne położenie pliku startowego, który ma być użyty.
Opcje pobierania
--bind-address=adres
Podczas tworzenia klienckich połączeń TCP/IP, wiąże z lokalnym komput
"bind()", zadany adres. Adres można podać jako nazwę hosta lub adres
przydać jeśli dany komputer ma przypisane kilka adresów IP.
-t liczba
--tries=liczba
Ustawia liczbę prób na liczbę. 0 lub inf oznacza próbowanie bez końca
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
6/38
wartość wynosi 20, z wyjątkiem błędów krytycznych, takich jak "connec
(odrzucono połączenie) lub "not found" (nie znaleziono - 404), gdy ni
ponownych prób.
-O plik
--output-document=plik
Dokumenty nie będą zapisywane do odpowiednich plików, ale wszystkie z
zapisane do pliku. Jeśli jako plik podano -, dokumenty będą zapisane
wyjście, wyłączając konwersję linków (proszę użyć ./-, aby zapisać do
-).
Użycie -O nie jest przeznaczone jako "użyj nazwy pliku zamiast tej z
to odpowiednik przekierowania powłoki: wget -O plik
jest z
> plik; plik zostanie natychmiast
zawartość pobierania zostanie do niego zapisana.
Z tego powodu, -N (sprawdzanie znacznika czasowego) nie jest obsługiw
z -O: ponieważ plik jest zawsze nowo tworzony, będzie miał on zawsze
znacznik czasowy. Przy użyciu tej kombinacji wyświetlane jest ostrzeż
Podobnie, używanie -r lub -p z -O może nie działać zgodnie z przewidy
będzie pobierał pierwszego pliku do pliku, a reszty do zwykłych plikó
pobierania zostanie umieszczona w pliku. Zostało to wyłączone w wersj
powróciło (z ostrzeżeniem) w 1.11.2, ponieważ są przypadki, gdzie tak
może mieć sens.
Proszę zauważyć, że kombinacja z -k jest dozwolona tylko przy pobiera
dokumentu, ponieważ w takim przypadku, wszystkie relatywne URI zostan
w URI zewnętrzne. Opcja -k nie ma sensu przy wielu URI, które zostały
pojedynczego pliku, stąd -k może być użyte tylko, jeśli wyjściem jest
-nc
--no-clobber
Jeśli plik jest pobierany więcej niż raz do tego samego katalogu, zac
zależy od kilku opcji, między innymi -nc. W pewnych przypadkach istn
plik będzie nadpisany lub przebity (ang. clobbered), przy powtórzeniu
innych przypadkach zostanie zachowany.
Przy uruchomieniu Wget bez opcji -N, -nc, -r lub -p pobranie tego sam
samego katalogu spowoduje pozostawienie pierwotnego egzemplarza pliku
drugiemu nazwy plik.1. Gdy plik będzie ściągany kolejny raz, trzeci
otrzyma nazwę file.2, i tak dalej (jest tak również z opcją -nd, nawe
równocześnie -r lub -p). Przy podanej opcji -nc, zachowanie takie je
a Wget odmawia pobrania nowszych kopii pliku. Dlatego też, "no-clobb
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
7/38
rzeczywistości złą nazwą dla tego trybu -- nie chroni on przed nadpis
temu zapobiegają już numeryczne przyrostki), ale przed zachowywaniem
pliku.
Przy uruchomieniu Wget z -r lub -p, ale bez -N, -nd czy -nc, ponowne
powoduje, że nowa kopia po prostu nadpisuje starą. Dodanie -nc zapob
zachowaniu, skutkując zamiast tego zachowaniem pierwotnej wersji i ig
ewentualnych nowych kopii z serwera.
Przy uruchomieniu Wget z -N, z opcją -r lub -p albo bez niej, decyzja
nową wersję pliku czy też nie, zależy od znaczników czasu (dat modyfi
rozmiarów lokalnego i zdalnego pliku. -nc nie można podawać równocze
Proszę zauważyć, że jeśli podano -nc, pliki z przyrostkami .html lub
odczytywane z dysku i przetwarzane tak, jakby zostały pobrane z sieci
--backups=kopia-zapasowa
Przed nadpisaniem pliku, istniejący jest zachowywany poprzez dodanie
w VMS) do nazwy pliku. Przy kolejnym przebiegu kolejne kopie zapasowe
zmieniane na .2, .3 itd., aż do osiągnięcia liczby kopii-zapasowych (
są usuwane).
-c
--continue
Kontynuuje pobieranie częściowo ściągniętego pliku. Przydatne, gdy c
ściąganie rozpoczęte w poprzednim przebiegu Wgeta lub przez inny prog
wget -c
ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
Jeśli w bieżącym katalogu istnieje plik ls-lR.Z, Wget przyjmie, że je
fragment zdalnego pliku i zażąda od serwera kontynuacji pobierania od
równego długości lokalnego pliku.
Proszę zauważyć, że nie ma potrzeby podawania tej opcji jeśli chcemy
aktualnie wywołany Wget ponownie próbował ściągać plik, w połowie któ
zerwane połączenie. Jest to zachowanie domyślne. Opcja -c wpływa ty
pobrań zaczętych przed bieżącym wywołaniem Wget i tylko dla tych plik
lokalne kopie nadal istnieją.
Bez -c, polecenie z poprzedniego przykładu pobrałby po prostu zdalny
ls-lR.Z.1, zostawiając w spokoju obcięty plik ls-lR.Z.
Począwszy od Wget 1.7, jeśli użyjemy -c dla niepustego pliku, a okaże
nie obsługuje kontynuacji ściągania, to program odmówi rozpoczęcia śc
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
8/38
które prowadziłoby do zniszczenia istniejącej zawartości. Jeśli napr
ściągać od początku, powinniśmy usunąć taki plik.
Również od wersji 1.7, jeśli użyjemy -c dla pliku, którego rozmiar je
na serwerze, to Wget odmówi ściągnięcia pliku i wypisze komunikat obj
samo dzieje się, gdy plik jest mniejszy na serwerze niż lokalnie (pra
dlatego, że został zmieniony na serwerze od czasu naszej ostatniej pr
ponieważ "kontynuacja" jest bezsensowna, pobieranie nie zachodzi.
Z drugiej strony, przy stosowaniu -c, każdy plik, który jest większy
lokalnie będzie uważany za nie w pełni ściągnięty. Wówczas pobranych
na koniec pliku lokalnego zostanie tylko "(wielkość(zdalny) - wielkoś
bajtów. W pewnych przypadkach takie zachowanie jest pożądane -- na p
skorzystać z wget -c do ściągnięcia tylko nowej porcji danych, dopisa
zbioru danych czy pliku dziennika.
Jednakże, jeśli plik na serwerze jest większy dlatego, że został zmie
tylko doklejono do niego dane, to w efekcie otrzymamy zniekształcony
żaden sposób nie może sprawdzić, czy lokalny plik jest poprawną częśc
zdalnego. Należy na to szczególnie uważać stosując -c w połączeniu z
plik będzie uważany za kandydata na "nieukończone ściąganie".
Inną sytuacja, w której przy korzystaniu z -c uzyskuje się zniekształ
zachodzi, gdy mamy do czynienia z ułomnym serwerami pośredniczącymi H
łańcuch "transfer interrupted" do lokalnego pliku. W przyszłości będ
opcja "rollback", obsługująca ten przypadek.
Proszę zauważyć, że -c działa tylko z serwerami FTP i HTTP, które obs
"Range".
--progress=typ
Umożliwia wskazanie typu wskaźnika postępu. Dozwolonymi rodzajami wsk
(kropka) i "bar" (pasek).
Domyślnie stosowany jest wskaźnik "bar". Rysowany jest wówczas pasek
ze znaków graficznych ASCII (zwany czasem wskaźnikiem "termometrowym"
stan pobierania. Jeżeli wyjściem programu nie jest TTY, to domyślnie
wskaźnik typu "dot".
Aby przełączyć się na zapis kropkowy należy użyć opcji --progres=dot.
pobieranie wypisując kropki, a każda oznacza określoną ilość pobranyc
Przy korzystaniu z tego wskaźnika, można także ustalić styl. Wykonuje
typ wskaźnika w postaci dot:styl. W różnych stylach pojedynczej kropc
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
9/38
różne znaczenie. W stylu "default" każda kropka oznacza 1K (tysiąc),
dziesięć kropek, a wiersz 50 kropek. Styl "binary" jest bardziej "ko
dla kropki, 16-kropkowe grupy i 48 kropek w wierszu (co daje 384K na
pobieraniu dużych plików odpowiedni jest styl "mega" -- każda kropka
pobrane 64K, w grupie jest osiem kropek, a w wierszu 48 (więc każdy w
3M). Jeśli "mega" jest niewystarczające, można użyć "giga" - każda kr
1M, w grupie jest osiem kropek, a w wierszu 32 (co daje 32M na wiersz
Proszę zauważyć, że domyślny styl można ustawić za pomocą polecenia "
pliku .wgetrc. Ustawienie można przesłonić w wierszu poleceń. Wyjątki
wyjście nie będące TTY, gdy pasek kropkowy jest faworyzowany w stosun
kreskowego. Aby wymusić pasek kreskowy, należy użyć polecenia --progr
-N
--timestamping
Włącza stosowanie znaczników czasu (time-stamping).
--no-use-server-timestamps
Nie ustawia znacznika czasu pliku lokalnego na podstawie znacznika z
Domyślnie, gdy plik jest pobierany, używany jest znacznik czasu pliku
Pozwala to na użycie opcji --timestamping w kolejnych wywołaniach wge
korzystniej jest ustawić znacznik czasu na podstawie rzeczywistego cz
tym celu powstała opcja --no-use-server-timestamps.
-S
--server-response
Wypisuje nagłówki wysyłane przez serwery HTTP i odpowiedzi wysyłane p
--spider
Wywołany z tą opcją, Wget będzie zachowywał się jak sieciowy pająk (W
znaczy, że nie będzie pobierał stron, a jedynie sprawdzał, czy tam są
wykorzystać to sprawdzenia zakładek (bookmarks), na przykład tak:
wget --spider --force-html -i bookmarks.html
Ta funkcja wymaga jeszcze wiele pracy, by Wget osiągnął możliwości zb
prawdziwych pająków WWW.
-T seconds
--timeout=sekundy
Ustawia sieciowy czas oczekiwania na sekundy sekund. Jest to odpowied
podania --dns-timeout, --connect-timeout i --read-timeout.
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
10/38
Podczas interakcji z siecią, Wget może sprawdzić czas oczekiwania i p
gdy zabiera zbyt dużo czasu. Zapobiega to takim anomaliom jak zawiesz
niekończące się łączenie. Jedynym domyślnym czasem oczekiwania jest 9
oczekiwanie na odczyt. Ustawienie "0", wyłączy go. Nie poleca się zmi
ustawień, chyba że wie się, co się robi.
Wszystkie opcje związane z czasami oczekiwania akceptują wartości dzi
ułamki sekundowe, np. 0.1 jest poprawną (choć bezsensowną) wartością
oczekiwania. Wartości mniejsze od sekundy są przydatne do sprawdzania
serwera lub w celu testowania opóźnienia sieciowego.
--dns-timeout=sekundy
Ustawia czas translacji adresów DNS na sekundy sekund. Jeśli translac
zostanie ukończona w podanym czasie, zakończy się błędem. Domyślnie,
czasowych innych niż wynikających z implementacji bibliotek systemowy
--connect-timeout=sekundy
Ustawia czas oczekiwania połączenia na sekundy sekund. Połączenia TCP
potrzebują więcej czasu do poprawnego nawiązania, zostaną przerwane.
oczekiwania połączenia nie jest zdefiniowany, z wyłączeniem rozwiązań
zaimplementowanych w bibliotekach systemowych.
--read-timeout=sekundy
Ustawia czasy oczekiwania odczytu (i zapisu) na sekundy sekund. "Czas
do czasu bezczynności, tzn. jeśli w dowolnej chwili pobierania, dane
otrzymywane przez więcej niż podana liczba sekund, to odczyt zwraca b
jest restartowane. Opcja ta nie wpływa bezpośrednio na czas trwania s
Zdalny serwer może oczywiście przerwać połączenie wcześniej, niż wyni
tej opcji. Domyślny czas oczekiwania odczytu wynosi 900 sekund.
--limit-rate=wielkość
Ogranicza prędkość pobierania do wielkość bajtów na sekundę. Wielkość
wyrażona w bajtach, kilobajtach (z przyrostkiem k lub megabajtach (z
Na przykład --limit-rate=20k ograniczy prędkość pobierania do 20 KB/s
przydatne, gdy z jakiegoś powodu nie chce się pozwolić Wgetowi na zaj
przepustowości łącza.
Opcja wymaga liczb dziesiętnych, połączonych z reguły z odpowiednim p
poprawną wartością jest na przykład --limit-rate=2.5k.
Proszę zauważyć, że implementację Wgeta jest wstrzymywanie transferu
tym, gdy odczyt sieciowy zabiera mniej czasu niż wynikałoby to z żąda
przepustowości. Ta strategia skutkuje ostatecznie spowolnieniem trans
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
11/38
wartości przybliżonej do podanej. Osiągnięcie zbalansowanego poziomu
potrwać, dlatego proszę się nie dziwić, że ograniczanie przepustowośc
dobrze w przypadku bardzo małych plików.
-w sekundy
--wait=sekundy
Odczekuje zadaną liczbę sekund pomiędzy kolejnymi pobraniami. Zaleca
opcji, gdyż zmniejsza obciążenie serwera dzięki rzadszym żądaniom. C
sekundach, można podać w minutach dodając przyrostek "m", w godzinach
lub w dniach - dodając "d".
Określanie dużej wartości tej opcji przydaje się jeśli sieć lub kompu
wyłączone. Wówczas Wget może odczekać wystarczająco długo, by rozsąd
się, że przed ponowną próbą błąd sieci został naprawiony. Na czas ocz
określony przez tę opcję wpływa --random-wait.
--waitretry=sekundy
Opcję tę stosujemy jeśli nie chcemy, by Wget czekał pomiędzy każdym p
pomiędzy ponawianymi próbami nieudanych pobrań. Wget zastosuje odcze
(linear backoff), czekając 1 sekundę po pierwszym niepowodzeniu z dan
następnie 2 sekundy po drugim niepowodzeniu z tym plikiem, aż do maks
sekund, jaką podano. Zatem, wartość 10 faktycznie spowoduje, że Wget
odczekiwał łącznie do (1 + 2 + ... + 10) = 55 sekund na każdy plik.
Domyślna wartość jaka zostanie przyjęta, wynosi 10 sekund.
--random-wait
W niektórych z ośrodków wykonywana jest analiza plików dziennikowych
która ma na celu zidentyfikowanie programów do pobierania, takich jak
na wyszukiwaniu statystycznie znaczących podobieństw między różnicami
upłynął pomiędzy kolejnymi żądaniami. Ta opcja powoduje, że dla zama
takimi analizami obecności Wgeta czas pomiędzy żądaniami będzie się w
1,5 * sekundy, gdzie sekundy podano opcją --wait (-w).
W artykule z 2001, w pewnej publikacji poświęconej rozwijaniu oprogra
popularnych platformach klienckich, podano kod wykonujący taką analiz
Autor sugerował blokowanie na poziomie adresu klasy C, co ma gwaranto
pobierające zostaną zablokowane niezależnie od zmiany adresów przedzi
DHCP.
Opcja --random-wait powstała z powodu tej właśnie nierozważnej porady
blokowanie wielu postronnych użytkowników ośrodka z powodu działań je
--no-proxy
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
12/38
Wyłącza używanie serwerów pośredniczących, nawet jeśli zdefiniowano o
zmienną środowiskową *_proxy.
-Q wielkość
--quota=wielkość
Określa ograniczenie wielkości pobieranych danych przy ściąganiu auto
podawany jest w bajtach (domyślnie), kilobajtach (z przyrostkiem k) l
przyrostkiem m).
Warto pamiętać, że ograniczenie to nigdy nie dotyczy pobierania pojed
Tak więc, jeśli podamy wget -Q10k
ftp://wuarchive.wustl.edu/ls-lR.gz
ściągnięty cały plik ls-lR.gz. Tak samo dzieje się nawet wówczas, gdy
poleceń zostanie wyszczególnionych kilka URL-i. Ograniczenie wielkośc
przestrzegane podczas pobierania rekurencyjnego lub według pliku wejś
można spokojnie napisać wget -Q2m -i witryny -- po przekroczeniu ogra
ściąganie zostanie przerwane.
Ustawienie limitu na 0 lub na inf znosi ograniczenie pobierania.
--no-dns-cache
Wyłącza buforowanie translacji DNS. Wget zwykle zapamiętuje przetłuma
DNS, dzięki czemu nie musi odpytywać ponownie serwera DNS w sprawie t
(zwykle małego) zestawu hostów, z których następuje pobieranie. Bufor
wyłącznie w pamięci; nowa kopia Wgeta ponownie odpyta serwery DNS.
W niektórych przypadkach zostało zgłoszone, że buforowanie nazw hostó
pożądane nawet, gdy trwa to tylko tyle, ile działanie Wgeta. Po użyci
wysyła nowe żądanie translacji DNS (bardziej precyzyjnie: nowe wywoła
lub getaddrinfo) przy każdym zestawianiu nowego połączenia. Proszę za
ta nie wpływa na buforowanie, które może być wykonywane przez odpowie
lub w zewnętrznej warstwie buforowania, takiej jak NSCD.
Jeśli przeznaczenie tej opcji nie jest całkowicie jasne, prawdopodobn
potrzeby jej stosowania.
--restrict-file-names=tryby
Zmienia znaki, które mają być cytowane w odnośnikach zewnętrznych pod
lokalnych nazw plików. Znaki, które są ograniczone przez tę opcję, są
zastępowane przez %HH, gdzie HH jest liczbą szesnastkową odpowiadając
znakowi. Opcję można wykorzystać również do wymuszenia określonej wie
Domyślnie, Wget cytuje znaki, które nie są prawidłowe lub bezpieczne
pliku w danym systemie operacyjnym, jak również znaki kontrolne, któr
wyświetlane. Opcja jest przydatna do zmiany wartości domyślnych, np.
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
13/38
został pobrany na partycję nienatywną, aby wyłączyć cytowanie znaków
aby jeszcze bardziej ograniczyć zestaw znaków, do wartości ASCII.
Tryby są zestawem wartości tekstowych, oddzielonych przecinkiem. Akce
wartościami są: unix, windows, nocontrol, ascii, lowercase i uppercas
i windows są wzajemnie sprzeczne (jedna przesłoni drugą), podobnie ja
uppercase. Dwie ostatnie są wartościami specjalnymi, ponieważ nie zmi
zestawu znaków do cytowania, lecz wymuszają przekształcenie ścieżek p
na, odpowiednio, małe litery i duże litery.
Jeśli użyje się trybu unix, to Wget będzie cytował znak / oraz znaki
przedziałów 0-31 i 128-159. Jest to domyślne zachowanie w systemach u
Przy podaniu trybu windows, Wget cytuje znaki \, |, /, :, ?, ", *, <,
kontrolne w przedziałach 0-31 i 128-159. Dodatkowo, w lokalnych nazwa
trybie windowsowym Wget oddziela nazwę komputera i port znakiem + zam
używa @ zamiast ? do oddzielenia części zapytania w nazwie pliku od r
URL który w trybie uniksowym zostałby zachowany jako
www.xemacs.org:4300/search.pl?input=blah, w trybie windowsowym zostan
www.xemacs.org+4300/search.pl@input=blah. Jest to domyślny tryb w sys
Tryb nocontrol wyłącza cytowanie znaków kontrolnych. Opcja ta ma sens
są URL-e zawierające znaki UTF-8 w systemie, który może zapisywać i w
plików w UTF-8 (część możliwych wartości bajtów używanych w sekwencja
się w zakresie wartości opisywanych przez Wgeta jako "kontrolne".
Tryb ascii cytuje wszystkie bajty spoza zakresu znaków ASCII (czyli w
Przydatne, gdy kodowanie nazw plików nie pasuje do tego używanego lok
-4
--inet4-only
-6
--inet6-only
Wymusza połączenia z adresami IPv4 lub IPv6. Z opcją --inet4-only lub
się wyłącznie z adresami IPv4, ignorując rekordy AAAA w DNS i odmawia
adresami IPv6 podanymi w URL-u. Analogicznie, opcja --inet6-only lub
łączenie się wyłącznie z adresami IPv6 i ignorowanie rekordów A i adr
Nie powinno się zwykle używać żadnej z tych opcji. Domyślnie, Wget ob
IPv6 będzie używał rodziny adresów określonych przez rekord DNS hosta
odpowie zarówno adresem IPv4 jak i IPv6, to Wget spróbuje połączyć si
kolei, dopóki mu się to nie uda (zob. też opcja --prefer-family opisa
Opcje te mogą posłużyć do celowego wymuszenia użycia rodzin adresów I
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
14/38
systemach o podwójnej rodzinie adresów, zwykle w celu pomocy w debugo
obsługi nieprawidłowej konfiguracji sieci. W tym samym czasie można u
z opcji --inet6-only i --inet4-only. Żadna z nich nie jest dostępna w
skompilowanym bez obsługi IPv6.
--prefer-family=none/IPv4/IPv6
Gdy do wyboru będzie kilka adresów, łączy się najpierw z adresami z p
Kolejność adresów zwrócona przez DNS domyślnie jest używana bez zmian
Zapobiega się w ten sposób fałszywym błędom i próbom łączenia przy do
hostów, które obsługują zarówno adresy IPv6 jak i IPv4 z sieci IPv4.
www.kame.net tłumaczy się na 2001:200:0:8002:203:47ff:fea5:3085 i 203
Jeśli preferowaną rodziną adresów jest "IPv4", to one są używane jako
preferowaną rodziną jest "IPv6", adresy IPv6 mają pierwszeństwo. Jeśl
wartością jest "none", to używana jest kolejność adresów zwracana prz
W przeciwieństwie do opcji -4 i -6, ta opcja nie wyklucza dostępu do
adresów - zmienia jedynie kolejność wykorzystania adresów. Proszę rów
zmiana kolejności wykonywana za pomocą tej opcji jest stabilna - nie
adresów w tej samej rodzinie. Oznacza to, że względna kolejność adres
IPv6, we wszystkich przypadkach pozostaje bez zmian.
--retry-connrefused
Uznaje "odrzucenie połączenia" za błąd przejściowy i próbuje ponownie
poddaje się w przypadku URL-i, przy których nie może się połączyć, po
uznawany jest za znak całkowitego niedziałania serwera i ponowne prób
przyniosłyby rezultatu. Opcja jest przeznaczona do tworzenia kopii lu
na niestabilnych serwerach, które mają tendencję do znikania na krótk
--user=użytkownik
--password=hasło
Określa użytkownika użytkownik i hasło hasło do pobierania plików za
HTTP. Można przesłonić te parametry za pomocą opcji --ftp-user i --ft
przypadku połączeń FTP oraz --http-user i --http-password w przypadku
--ask-password
Pyta o hasło po zestawieniu każdego połączenia. Nie można użyć tej op
ponieważ wzajemnie się wykluczają.
--no-iri
Wyłącza obsługę URI ze znakami narodowymi (IRI). Opcja --iri włącza j
jest domyślnie włączona.
Można ustawić domyślną wartość obsługi IRI za pomocą polecenia iri w
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
15/38
może być przesłonięte z wiersza poleceń.
--local-encoding=kodowanie
Wymusza użycie kodowania jako domyślnego kodowania systemowego. Wpływ
jaki Wget przekształca URL-e podane jako argumenty do kodowania UTF-8
IRI.
Wget używa funkcji nl_langinfo(), a następnie zmiennej środowiskowej
ustalenia kodowania. Jeśli nie powiedzie się to, używane jest ASCII.
Można ustawić domyślne kodowanie lokalne za pomocą polecenia local_en
które może być przesłonięte z wiersza poleceń.
--remote-encoding=kodowanie
Wymusza użycie kodowania jako domyślnego kodowania serwera zdalnego.
sposób tłumaczenia URI znajdowanych w plikach, z kodowania zdalnego n
pobierania rekurencyjnego.Opcja jest przydatna tylko do obsługi IRI,
interpretacji znaków spoza ASCII.
W przypadku HTTP, kodowanie zdalne można znaleźć w nagłówku HTTP Cont
metaznaczniku Content-Type http-equiv.
Można ustawić domyślne kodowanie za pomocą polecenia remoteencoding w
może być przesłonięte z wiersza poleceń.
--unlink
Wymusza wykonywanie unlink na plikach, zamiast przebijania plików ist
jest przydatna w przypadku pobierania do katalogu zawierającego dowią
(twarde).
Opcje katalogów
-nd
--no-directories
Nie tworzy hierarchii katalogów przy pobieraniu rekurencyjnym. Po wł
wszystkie pliki będą zapisywane do bieżącego katalogu bez przebijania
pojawi się więcej niż raz, nazwy plików otrzymają rozszerzenie .n).
-x
--force-directories
Przeciwieństwo -nd. Wymusza utworzenie hierarchii katalogów nawet jeś
być stworzona. Np. wget -x
http://fly.srk.fer.hr/robots.txt
zapisze
jako fly.srk.fer.hr/robots.txt.
-nH
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
16/38
--no-host-directories
Wyłącza tworzenie katalogów z nazwą hosta jako przedrostkiem. Domyśln
spowoduje utworzenie struktury katalogów zaczy
fly.srk.fer.hr/, gdzie trafi cała reszta. Ta opcja wyłącza takie zach
--protocol-directories
Używa nazwy protokołu jako części nazwy katalogu plików lokalnych. Na
użyciu tej opcji wget -r http://host zostanie zapisane do katalogu ht
zamiast do host/....
--cut-dirs=liczba
Ignoruje podaną liczbę składowych katalogu. Przydatne do precyzyjneg
katalogami, w których będą składowane pliki z pobierania rekurencyjne
Weźmy, na przykład, katalog
ftp://ftp.xemacs.org/pub/xemacs/
. Jeżeli
-r, to lokalnie zostanie zachowany jako ftp.xemacs.org/pub/xemacs/.
pozwala na usunięcie części ftp.xemacs.org/, nadal utkniemy z pub/xem
z pomocą przychodzi --cut-dirs. Powoduje, że Wget "nie widzi" zadane
składowych zdalnego katalogu. Oto kilka przykładów pokazujących, jak
--cut-dirs.
Brak opcji -> ftp.xemacs.org/pub/xemacs/
-nH -> pub/xemacs/
-nH --cut-dirs=1 -> xemacs/
-nH --cut-dirs=2 -> .
--cut-dirs=1 -> ftp.xemacs.org/xemacs/
...
Jeśli chcemy po prostu pozbyć się struktury katalogów, to opcja ta je
kombinacji -nd i -P. Jednak --cut-dirs, w przeciwieństwie do -nd, nie
podkatalogów -- na przykład, przy -nH --cut-dirs=1, podkatalog beta/
oczekiwaniami, umieszczony w xemacs/beta.
-P prefiks
--directory-prefix=prefiks
Ustawia przedrostek katalogów na prefiks. Przedrostek katalogów oznac
zostaną zapisane wszystkie inne pliki i katalogi, tzn. wierzchołek dr
Domyślnym przedrostkiem jest ., katalog bieżący.
Opcje HTTP
--default-page=nazwa
Używa nazwy jako domyślnej nazwy pliku, gdy nie jest ona znana (np. w
kończących się ukośnikiem), zamiast index.html.
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
17/38
-E
--adjust-extension
Jeśli pobierany jest plik typu application/xhtml+xml lub text/html a
kończy się wyrażeniem regularnym \.[Hh][Tt][Mm][Ll]?, to opcja ta spo
przyrostka .html do lokalnej nazwy pliku. Przydatne, na przykład, gdy
lustrzaną witryny, która używa stron .asp, ale chcemy, by pozyskane s
przeglądać za pomocą własnego serwera Apache. Innym dobrym zastosowan
pobieranie wyjścia generowanego przez skrypty CGI. URL typu
?25 zostanie zachowany jako article.cgi?25
Proszę zauważyć, że pliki o zmienionych w ten sposób nazwach będą pon
za każdym razem gdy będziemy odświeżać kopię lustrzaną witryny. Dziej
ponieważ Wget nie potrafi stwierdzić, że lokalny plik X.html odpowiad
URL-owi X (gdyż nie wie, że ten URL tworzy wyjście typu text/html lub
application/xhtml+xml).
Wget upewni się też (stan na wersję 1.12), że pobierane pliki typu te
przyrostkiem .css. Zmieniono nazwę tej opcji z --html-extension, aby
nowe zachowanie. Stara nazwa opcji jest wciąż akceptowana, ale jest p
W przyszłości, opcja może zostać poszerzona, aby objąć również przyro
zawartości, w tym takich, które nie są przetwarzane przez Wget.
--http-user=użytkownik
--http-password=hasło
Określa nazwę użytkownika i hasło, które Wget prześle serwerowi HTTP.
rodzaju protokołu wezwanie-odpowiedź, Wget koduje je stosując albo uw
podstawowe (basic, niechronione), albo w oparciu o skrót (digest) lub
z metody Windowsa (NTLM).
Inną metodę podania nazwy i hasła użytkownika jest wyszczególnienie i
Obie te metody ujawniają hasło każdemu, kto zechce uruchomić ps. Żeb
przed podpatrzeniem, należy przechowywać je w pliku .wgetrc lub .netr
chmod, zapewnić tym plikom ochronę przed innymi użytkownikami. Jeżeli
naprawdę ważne, w tych plikach też nie należy trzymać ich na stałe --
z plików zaraz po rozpoczęciu pobierania przez Wgeta.
--no-http-keep-alive
Wyłącza funkcję "keep-alive" pobierań HTTP. Wget zwykle prosi serwer
otwartego połączenia, dzięki czemu, jeśli pobiera się więcej niż jede
samego serwera, są przesyłane tym samym połączeniem TCP. Oszczędza to
obciążenie serwera.
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
18/38
Opcja jest przydatna, gdy połączenia stałe (keep-alive) nie działają
powodu błędu serwera lub niemożności obsługi takich połączeń przez sk
serwera.
--no-cache
Wyłącza buforowanie po stronie serwera. W takim przypadku Wget wysył
serwerowi odpowiednią komendę (Pragma: no-cache), dzięki której plik
z usługi zdalnej, a nie zwrócona zostanie wersja buforowana. Jest to
przydatne do pobierania i wymiatania przeterminowanych dokumentów z s
Domyślnie, buforowanie jest dozwolone.
--no-cookies
Wyłącza używanie ciasteczek (cookies). Ciasteczka są mechanizmem do p
stanu po stronie serwera. Serwer przesyła klientowi ciasteczko stosu
Set-Cookie, a klient przy późniejszych żądaniach odpowiada tym samym
Ponieważ ciasteczka umożliwiają właścicielom serwera prowadzenie reje
wymianę się tymi informacjami z innymi ośrodkami, niektórzy uważają j
prywatności. Domyślnie cookies są używane, jednak ich zapisywanie ni
włączone.
--load-cookies plik
Przed pierwszym pobraniem HTTP wczytuje ciasteczka z pliku. Plik jes
tekstowym w formacie, jaki pierwotnie zastosowano dla pliku cookies.t
Netscape.
Na ogół korzysta się z tej opcji przy tworzeniu kopii lustrzanych tyc
do skorzystania z części lub całości zasobów wymagają zalogowania się
logowania się zwykle polega na tym, że po otrzymaniu od nas informacj
uwierzytelniającej i jej zweryfikowaniu serwer WWW wysyła ciasteczko
gdy przeglądarka sięga do zasobów, odsyła serwerowi otrzymane ciastec
potwierdzając w ten sposób naszą tożsamość.
Utworzenie kopii tego rodzaju witryny wymaga wysyłania przez Wget tak
ciasteczek, jakie podczas komunikowania się z tym ośrodkiem przesyła
przeglądarka. Osiąga się to za pomocą --load-cookies -- wystarczy wsk
lokalizację pliku cookies.txt, a on wyśle te same ciasteczka, które w
sytuacji wysłałaby przeglądarka. Poszczególne przeglądarki przechowuj
ciasteczek w różnych miejscach:
"Netscape 4.x."
Ciasteczka są w
"Mozilla and Netscape 6.x."
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
19/38
Plik ciasteczek Mozilli nazywa się również cookies.txt, jest poło
, w katalogu właściwym dla profilu użytkownika. Pełna ś
kończy się czymś w rodzaju
"Internet Explorer."
Ciasteczko, jakiego mógłby użyć Wget, można utworzyć korzystając
opcji "Importuj i Eksportuj", "Eksportuj pliki cookie". Zostało
z Internet Explorerem 5 -- nie ma gwarancji, że będzie działać z
wersjami.
"Other browsers."
Jeżeli do tworzenia ciasteczek korzysta się z innej przeglądarki,
będzie działać tylko wtedy, gdy uda się je zlokalizować lub utwor
ciasteczek w formacie Netscape, jakiego oczekuje Wget.
Jeśli nie można skorzystać z --load-cookies, jest jeszcze inna możliw
używana przeglądarka udostępnia "menedżera plików cookie", można z ni
żeby podglądnąć ciasteczka, jakie zostały wykorzystane podczas uzyski
witryny, której kopię chce się utworzyć. Proszę zapisać nazwę i warto
następnie ręcznie nakazać Wgetowi wysłanie ciasteczka o zadanej posta
równocześnie "oficjalny" kod odpowiedzialny za obsługę ciasteczek:
wget --no-cookies --header "Cookie:I<nazwa>=I<wartość>"
--save-cookies plik
Zachowuje ciasteczka do pliku przed wyjściem. Nie zostaną zapisane ci
przeterminowane lub nieposiadające daty ważności (zwane "ciasteczkami
por. --keep-session-cookies.
--keep-session-cookies
Po podaniu, powoduje że --save-cookies zachowuje również ciasteczka s
zwykle nie są zapisywane, ponieważ są przeznaczone do zachowania w pa
z niej po zamknięciu przeglądarki. Zachowywanie ich może być przydatn
które wymagają logowania lub odwiedzenia strony głównej przed uzyskan
innych stron. Po skorzystaniu z tej opcji, różne przebiegi Wgeta mogą
jako jedna sesja przeglądarki, w zależności od strony internetowej.
Ponieważ format pliku ciasteczek nie przechowuje zwykle ciasteczek se
oznacza je znacznikiem czasowym przedawnienia równym 0. Opcja --load-
rozpoznaje je jako ciasteczka sesyjne, lecz może to zmylić inne przeg
zwrócić uwagę, że tak załadowane ciasteczka będą traktowane jak inne
co oznacza, że trzeba użyć opcji --keep-session-cookies ponownie, aby
pomocą opcji --save-cookies.
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
20/38
--ignore-length
Niestety, niektóre serwery HTTP (dokładniej mówiąc, programy CGI) wy
nagłówki Content-Length, co powoduje, że Wget głupieje, sądząc, że ni
całość dokumentu. Syndrom ten można uchwycić, gdy Wget próbuje w kół
sam dokument, za każdym razem twierdząc, że (inaczej niż zwykle) połą
zamknięte na dokładnie tym samym bajcie.
Wywołany z tą opcją, Wget będzie ignorował nagłówek Content-Length, t
istniał.
--header=wiersz-nagłówka
Wysyła wiersz-nagłówka razem z pozostałą częścią nagłówka w każdym żą
Podany nagłówek jest wysyłany bez zmian, tak więc musi zawierać nazwę
dwukropku) i nie może zawierać znaku nowego wiersza.
Możliwe jest określenie więcej niż jednego dodatkowego nagłówka przez
podanie opcji --header.
wget --header='Accept-Charset: iso-8859-2' \
--header='Accept-Language: hr' \
Podanie pustego łańcucha jako nagłówka kasuje wszystkie uprzednio zde
użytkownika nagłówki.
Od Wgeta 1.10, można użyć tej opcji do przesłonięcia nagłówków, które
wygenerowane automatycznie. Oto przykład nakazania Wgetowi połączenie
lokalnym, jednak podając foo.bar w nagłówku Host:
wget --header="Host: foo.bar"
W wersjach poniżej 1.10, takie użycie opcji --header powodowało wysył
zduplikowanych nagłówków.
--max-redirect=liczba
Określa maksymalną liczbę przekierowań w celu dotarcia do zasobu. Dom
20, czyli znaczniej więcej niż z reguły potrzeba. Opcja może się przy
zajdzie potrzeba pozwolenia na więcej (lub mniej) przekierowań.
--proxy-user=użytkownik
--proxy-passwd=hasło
Określają nazwę użytkownika i hasło, które zostaną użyte do uwierzyte
serwerze pośredniczącym. Wget koduje je stosując podstawowy (basic) s
uwierzytelniania.
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
21/38
Odnoszą się do tego podobne zagadnienia związane z bezpieczeństwem, j
opcji --http-password.
--referer=url
Zamieszcza nagłówek "Referer: url" w żądaniu HTTP. Przydatne do pobi
z takim przetwarzaniem po stronie serwera, które zakłada, że są one z
przez interaktywne przeglądarki internetowe i uznawane za poprawne ty
Referer jest ustawione na jedną ze stron, które na nie wskazują.
--save-headers
Zapisuje nagłówki wysyłane przez serwer HTTP do pliku, przed właściwą
pustym wierszem jako separatorem.
-U nazwa-agenta
--user-agent=nazwa-agenta
Serwerowi HTTP przedstawia się jako agent o podanej nazwie.
Protokół HTTP pozwala klientom na podanie, za pomocą pola User-Agent
tożsamości. Umożliwia to rozróżnianie oprogramowania WWW, zwykle do
statystycznych lub śledzenia naruszeń protokołu. Wget normalnie przed
Wget/wersja, gdzie wersja jest aktualnym numerem wersji programu.
Znane są jednak pewne witryny narzucające politykę przykrawania wynik
informacji dostarczonej im w polu User-Agent. Mimo iż koncepcyjnie ni
zły pomysł, zaczął być nadużywany przez serwery odmawiające informacj
niż (kiedyś) Netscape lub, częściej, Internet Explorer. Ta opcja umoż
linii User-Agent wysyłanej przez Wget. Nie zachęcamy do używania tej
pełną świadomością.
Podanie pustego łańcucha za pomocą --user-agent="" powoduje, że Wget
wysyłał nagłówka User-Agent w żądaniach HTTP.
--post-data=łańcuch
--post-file=plik
Używa metody POST do wszystkich żądań HTTP i wysyła podane dane w cie
--post-data wysyła łańcuch jako dane, podczas gdy --post-file wysyła
W pozostałych aspektach ich działanie jest identyczne. W szczególnośc
oczekują zawartości w postaci klucz=wartość&klucz2=wartość2, kodowani
specjalnych w postaci procentowej; jedyną różnicą jest, że jedna ocze
jako parametru wiersza polecenia, a druga akceptuje swą treść z pliku
szczególności, --post-file nie przysyła plików w postaci załączników,
dane w postaci klucz=wartość (z właściwym kodowaniem "procentowym"),
wyżej. Wget nie obsługuje obecnie multipart/form-data przy przesyłani
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
22/38
jedynie application/x-www-form-urlencoded. Proszę użyć jedynie jednej
--post-data i --post-file.
Proszę zauważyć, że wget nie wymaga aby zawartość była w postaci
"klucz1=wartość1&klucz2=wartość2" ani nie sprawdza tego. Wget przesył
jakie mu dostarczono. Większość serwerów oczekuje jednak, aby dane PO
powyższej postaci przy przetwarzaniu formularzy HTML.
Proszę zwrócić uwagę, że Wget musi znać rozmiar danych POST z góry. W
argumentem do opcji --post-file musi być zwykły plik; przekazanie pot
czegoś takiego jak /dev/stdin nie zadziała. Nie jest do końca jasne,
ograniczenie wpisane w protokół HTTP/1.0. Choć HTTP/1.1 wprowadza tra
fragmentaryczny, który nie wymaga wiedzy o długości żądania z góry, t
go używać, dopóki nie wie, że komunikuje się z serwerem HTTP/1.1. Nie
wiedzieć, dopóki nie otrzyma odpowiedzi, która wymaga pełnego żądania
Uwaga: Według stanu na wersję 1.15 przy przekierowaniu Wgeta po sfina
POST, zachowanie programu będzie zależało od kodu zwróconego przez se
będzie to 301 Moved Permanently, 302 Moved Temporarily lub 307 Tempor
Wget, zgodnie z RFC2616,, będzie kontynuował wysyłanie żądania POST.
zmienić metodę żądań klienta przy przekierowaniu powinien wysłać kod
Przykład pokazuje, jak zalogować się do serwera używającego POST, a n
do pobierania żądanych stron, dostępnych prawdopodobnie tylko dla uży
uwierzytelnionych:
# Logowanie do serwera. Można to zrobić tylko raz.
wget --save-cookies cookies.txt \
--post-data 'user=foo&password=bar' \
# Teraz przechwytujemy stronę lub strony o które nam chodzi.
wget --load-cookies cookies.txt \
-p
http://server.com/interesting/article.php
Jeśli serwer używa ciasteczek sesji do śledzenia uwierzytelnienia uży
powyższy przykład nie zadziała, ponieważ --save-cookies nie zachowa i
przeglądarki), a plik cookies.txt będzie pusty. W takim przypadku, op
--save-cookies należy użyć również --keep-session-cookies.
--method=metoda-HTTP
Do skryptów "restowych" (RESTfull, gdzie REST oznacza Representationa
Wget pozwala na wysłanie innych metod HTTP bez konieczności jawnego u
przy pomocy opcji --header=Header-Line. Wget użyje takiego łańcucha,
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
23/38
podany po --method jako metoda HTTP do serwera.
--body-data=łańcuch-danych
--body-file=plik-danych
Opcja musi być ustawiona gdy konieczne jest wysłanie dodatkowych dany
przy użyciu metody podanej w --method. --body-data wysyła łańcuch-dan
--body-file wysyła zawartość pliku-danych. Poza tym obie opcje działa
Obecnie --body-file nie służy do transmisji plików jako całości. Wget
tej chwili "multipart/form-data" do transmisji danych, a jedynie
"application/x-www-form-urlencoded". W przyszłości może się to zmieni
wysyłał --body-file jako cały plik zamiast wysyłania jego zawartości
zauważyć, że Wget musi znać wpierw zawartość danych BODY, dlatego arg
--body-file powinien być zwykłym plikiem. Więcej szczegółów znajduje
opcji --post-file. Powinno się podawać albo opcję --body-data albo --
Jeśli Wget zostanie przekierowany po sfinalizowaniu żądania, wznowi b
będzie wysyłał żądanie GET aż do zakończenia przekierowania. Jest tak
wszystkich kodów z wyjątkiem 307 Temporary Redirect, który służy do b
wskazania, ze metoda nie powinna się zmienić. Inny wyjątek ma miejsce
ustawiona na "POST", ponieważ wówczas przestrzegane są zasady określo
--post-data.
--content-disposition
Opcja włącza eksperymentalną (niepełną) obsługę nagłówka Content-Disp
obecnie spowodować dodatkowe kluczenie serwera związane z żądaniami H
również kilka błędów, co powoduje, że opcja ta domyślnie nie jest włą
Opcja jest przydatna niektórym programom CGI pobierającym pliki, któr
nagłówków Content-Disposition do opisania nazwy pobieranego pliku.
--content-on-error
Jeśli ta opcja jest włączona, to wget nie będzie pomijał zawartości g
kodem statusu http wskazującym na błąd.
--trust-server-names
Jeśli jest włączona, przy przekierowaniu ostatnia część przekierowują
używana jako lokalna nazwa pliku. Domyślnie korzysta się z ostatniej
pierwotnego.
--auth-no-challenge
Jeśli opcja jest podana, Wget będzie wysyłał proste (Basic) informacj
uwierzytelniające HTTP (nazwa użytkownika i hasło w jawnym tekście) p
żądaniach, tak jak domyślnie robił to Wget w wersjach 1.10.2 i wcześn
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
24/38
Używanie tej opcji nie jest zalecane, jako że została przeznaczona je
obsługiwania kilku zapomnianych serwerów, które nigdy nie wysyłają py
uwierzytelnienie HTTP, lecz akceptują nieżądane informacje uwierzytel
uwierzytelnienia opartego na formularzu.
Opcje (SSL/TLS) HTTPS
W celu obsługi szyfrowanych pobierań HTTP (HTTPS), Wget musi być skompilo
biblioteką SSL - obecnie OpenSSL. Jeśli Wget jest skompilowany bez obsług
tych opcji nie będzie dostępna.
--secure-protocol=protokół
Wybiera protokół zabezpieczeń. Poprawnymi wartościami są auto, SSLv2,
PFS. Jeśli używane jest auto, automatycznego wyboru protokołu dokonuj
co jest osiągane przez wysłanie pozdrowienia SSLv2 z informacją o obs
TLSv1. Tak jest domyślnie.
Podanie SSLv2, SSLv3 lub TLSv1 wymusza użycie odpowiedniego protokołu
przydatne przy komunikacji ze starymi i błędnymi implementacjami SSL
nie pozwalają na łatwy wybór poprawnej wersji protokołu przez bibliot
szczęście, takie serwery są rzadkością.
Określenie PFS wymusza używanie zestawów kluczy Perfect Forward Secur
skrócie, PFS zwiększa bezpieczeństwo tworząc jednorazowy klucz do każ
Używa też nieco więcej mocy CPU zarówno na kliencie jak i na serwerze
które są uznawane za bezpieczne (tzn. np nie jest to MD4) oraz protok
--https-only
W trybie rekurencyjnym podąża wyłącznie za odnośnikami HTTPS.
--no-check-certificate
Nie sprawdza certyfikatu serwera pod kątem dostępnego ośrodka certyfi
również tego, aby nazwa hosta URL-a pasowała do nazwy ogólnej w certy
Od wersji 1.10, Wget domyślnie weryfikuje certyfikat serwera w odnies
ośrodków certyfikacji, przerywając nawiązanie połączenia SSL (handsha
pobieranie pliku, jeśli weryfikacja się nie powiedzie. Choć zwiększa
bezpieczeństwo pobierań, zrywa to jednak kompatybilność z niektórymi
działały z poprzednimi wersjami Wgeta, szczególnie korzystającymi z p
siebie, wygasłych lub niepoprawnych z innego powodu certyfikatów. Opc
"niebezpieczny" tryb działania, który zmienia błędy weryfikacji certy
ostrzeżenia i pozwala kontynuować.
Jeśli wystąpią błędy "weryfikacji certyfikatu" lub błąd o treści "naz
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
25/38
nie pasuje do żądanej nazwy hosta", można użyć tej opcji aby ominąć w
kontynuować pobieranie. Proszę używać tej opcji tylko wtedy, gdy jest
o wiarygodności strony lub gdy kompletnie nie dba się o poprawność je
Przy przesyłaniu poufnych lub ważnych danych, niesprawdzanie certyfik
bardzo złym pomysłem.
--certificate=plik
Używa certyfikatu klienta z pliku. Jest to konieczne w przypadku serw
certyfikatów od klientów, którzy się z nimi łączą. Zwykle taki certyf
wymagany, a ten przełącznik jest opcjonalny.
--certificate-type=typ
Określa typ certyfikatu klienta. Poprawnymi wartościami są PEM (zakła
DER, znany również jako ASN1.
--private-key=plik
Odczytuje klucz prywatny z pliku. Pozwala to na dostarczenie klucza p
oddzielnym od certyfikatu pliku.
--private-key-type=typ
Określa typ klucza prywatnego. Akceptowanymi wartościami są PEM (domy
--ca-certificate=plik
Używa pliku jako pliku z zestawem ośrodków certyfikacji ("CA") do wer
pośredników. Certyfikaty muszą być w formacie PEM.
Bez tej opcji, Wget szuka certyfikatów CA w lokalizacji systemowej, w
instalacji OpenSSL.
--ca-directory=katalog
Określa katalog zawierający certyfikaty CA w formacie PEM. Każdy plik
certyfikat CA, a nazwa pliku jest oparta o wartości skrótu wyliczoneg
certyfikatu. Osiąga się to przetwarzając katalog certyfikatów narzędz
pochodzącego z OpenSSL. Używanie --ca-directory jest efektywniejsze o
--ca-certificate w przypadku, gdy zainstalowanych jest wiele certyfik
pozwala Wgetowi pobierać certyfikaty na żądanie.
Bez tej opcji, Wget szuka certyfikatów CA w lokalizacji systemowej, w
instalacji OpenSSL.
--random-file=plik
Używa pliku jako źródła losowych danych służących za ziarno do genera
pseudolosowych, w systemach pozbawionych /dev/random.
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
26/38
W takich systemach biblioteka SSL wymaga zewnętrznego źródła losowośc
pracy. Może być EGD (por. --egd-file poniżej) lub odczyt z zewnętrzne
podanego przez użytkownika. Jeśli nie poda się tej opcji, Wget poszuk
w $RANDFILE lub, jeśli zmienna nie jest ustawiona, w $HOME/.rnd. Jeśl
się nie powiedzie, prawdopodobnie nie będzie się dało zastosować szyf
Pojawienie się błędu "Could not seed OpenSSL PRNG; disabling SSL." oz
zapewnić losowe dane korzystając z jednej z powyższych metod.
--egd-file=plik
Używa pliku jako gniazda EGD. EGD to skrót od Entropy Gathering Daemo
pozyskujący entropię), programu działającemu w przestrzeni użytkownik
dane z różnych nieprzewidywalnych źródeł w systemie i udostępnia je i
które mogą ich potrzebować. Oprogramowanie szyfrujące, takie jak bibl
źródeł niepowtarzającej się losowości, do wykorzystania jako ziarno g
losowych, używanego do tworzenia kluczy silnych kryptograficznie.
OpenSSL pozwala użytkownikowi podać swoje źródło entropii za pomocą z
środowiskowej RAND_FILE. Jeśli pozostanie ona nieustawiona lub podany
wystarczającej losowości, OpenSSL odczyta dane losowe z gniazda EGD p
opisywanej opcji.
Jeśli nie poda się tej opcji (ani nie użyje się równoważnego poleceni
uruchomieniowego), EGD nigdy nie zostanie użyte. Mechanizm ten nie je
nowoczesnych systemach uniksowych, obsługujących /dev/random.
--warc-file=plik
Używa pliku jako celu pliku WARC.
--warc-header=łańcuch
Używa łańcucha jako rekordu warcinfo.
--warc-max-size=rozmiar
Ustawia maksymalny rozmiar plików WARC na rozmiar.
--warc-cdx
Zapisuje pliku indeksu CDX.
--warc-dedup=pliku
Nie przechowuje rekordów wyszczególnionych w danym pliku CDX.
--no-warc-compression
Nie kompresuje plików WARC za pomocą GZIP.
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
27/38
--no-warc-digests
Nie oblicza sum SHA1.
--no-warc-keep-log
Nie przechowuje pliku dziennika w rekordzie WARC.
--warc-tempdir=katalog
Określa położenie plików tymczasowych tworzonych przy zapisie WARC.
Opcje FTP
--ftp-user=użytkownik
--ftp-password=hasło
Określa nazwę użytkownika i hasło serwera FTP. Bez tej opcji (i równo
uruchomieniowej) używane jest domyślne hasło -wget@, używane zwykle d
FTP.
Inną metodę podania nazwy i hasła użytkownika jest wyszczególnienie i
Obie te metody ujawniają hasło każdemu, kto zechce uruchomić ps. Żeb
przed podpatrzeniem, należy przechowywać je w pliku .wgetrc lub .netr
chmod, zapewnić tym plikom ochronę przed innymi użytkownikami. Jeżeli
naprawdę ważne, w tych plikach też nie należy trzymać ich na stałe --
z plików zaraz po rozpoczęciu pobierania przez Wgeta.
--no-remove-listing
Nie usuwa tymczasowych plików .listing generowanych przez odczyty FTP
pliki te zawierają nieprzetworzone listingi katalogów otrzymane z ser
Pozostawienie ich może się przydać do celów diagnostycznych lub łatwe
zawartości katalogów zdalnego serwera (np. do sprawdzenia, że tworzon
jest kompletna).
Proszę zauważyć, że mimo iż Wget zapisuje w tym przypadku do pliku o
nie jest to dziura w zabezpieczeniach w sytuacji, gdy użytkownik stwo
dowiązanie symboliczne do
czy innego pliku i poprosi supe
(roota) o uruchomienie Wget w tym katalogu. W zależności od użytych
odmówi zapisu do .listing (co spowoduje niepowodzenie operacji na mas
rekurencyjnej czy zależnej od znaczników czasu), albo dowiązanie symb
usunięte i zastąpione faktycznym plikiem .listing, albo też listing z
do pliku .listing.numer.
Choć ta sytuacja nie stwarza kłopotów, jednak root nie powinien nigdy
w katalogu niezaufanego użytkownika. Użytkownik taki mógłby na przyk
index.html do
i poprosić "root"a o uruchomienie Wget z op
tak że plik ten zostałby nadpisany.
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
28/38
--no-glob
Wyłącza obsługę masek w przypadku FTP. Obsługa masek oznacza, że moż
specjalnych, uogólniających (wieloznaczników), takich jak *, ?, [ i ]
większej liczby plików z tego samego katalogu naraz, np.
wget
Domyślnie obsługa masek będzie włączona jeśli URL zawiera znaki uogól
opcji można użyć do włączenia bądź wyłączenia obsługi masek na stałe.
Może zajść potrzeba ujęcia URL-a w znaki cudzysłowu, by uchronić go p
przez powłokę. Obsługa masek powoduje, że Wget oczekuje listingu kata
postać jest zależna od systemu. Z tego powodu obecnie działa tylko z
serwerami FTP (i z tymi, które potrafią emulować wyjście uniksowego l
--no-passive-ftp
Wyłącza użycie pasywnego trybu transferu FTP. Pasywny FTP nakazuje kl
się z serwerem zestawić połączenie, zamiast wykorzystywać inne rozwią
Jeśli komputer ma bezpośrednie połączenie z Internetem, to zarówno pa
aktywne FTP powinny działać tak samo dobrze. Za większością zapór sie
konfiguracji NAT, pasywny FTP ma większą szansę działania. Jednak w n
rzadkich konfiguracjach zapór, aktywny FTP działa, a pasywny FTP nie.
prawdopodobieństwo, że ma miejsce ta sytuacja, proszę użyć opisywanej
ustawić w swym pliku konfiguracyjnym passive_ftp=off.
--preserve-permissions
Zachowuje uprawnienia zdalnych plików zamiast uprawnień wynikających
--retr-symlinks
Zwykle przy rekurencyjnym pobieraniu katalogów FTP, gdy program natkn
dowiązanie symboliczne, plik docelowy nie jest pobierany, natomiast t
odpowiednie dowiązanie w lokalnym systemie plików. Plik docelowy nie
chyba że pobieranie rekurencyjne dosięgło go bezpośrednio.
Przy opcji --retr-symlinks Wget podąża za dowiązaniem symbolicznym i
który ono wskazuje. Obecnie opcja ta nie powoduje tłumaczenia dowiąza
katalogów i dalszego pobierania rekurencyjnego w nim, lecz w przyszło
otrzymać taką możliwości.
Proszę zauważyć, że przy pobieraniu pliku (nie katalogu) podanego w w
nie osiągniętego z powodu pobierania rekurencyjnego, opcja nie odnosi
przypadkach plik docelowy dowiązania jest zawsze pobierany.
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
29/38
Opcje pobierania rekurencyjnego
-r
--recursive
Włącza pobieranie rekurencyjne. Domyślny maksymalny poziom wynosi 5.
-l głębokość
--level=głębokość
Podaje maksymalny poziom głębokości rekurencji.
--delete-after
Ta opcja nakazuje Wget usunięcie każdego z plików, jaki pobiera, po w
ściągania. Jest przydatna do pobierania wstępnego (prefetching) popu
poprzez serwer pośredniczący, np.:
wget -r -nd --delete-after
http://whatever.com/~popular/page/
Opcja -r nakazuje pobieranie rekurencyjne, a -nd nietworzenie katalog
Proszę zauważyć, że --delete-after usuwa pliki z lokalnego komputera.
polecenia DELE, na przykład zdalnym ośrodkom FTP. Także jeśli podano
to --convert-links jest ignorowane, więc przede wszystkim pliki .orig
tworzone.
-k
--convert-links
Po zakończeniu pobierania konwertuje odnośniki w dokumencie tak, by n
lokalnego przeglądania. Dotyczy to nie tylko widzialnych odnośników h
ale każdej części dokumentu, która prowadzi do zewnętrznych materiałó
obrazki, odnośniki do arkuszy stylów, odnośniki hipertekstowe do zawa
HTML, itp.
Każdy odnośnik będzie zmieniony na jeden z dwu sposobów:
· Odnośniki do plików, które zostały ściągnięte przez Wget zostaną
odwoływały się do pliku, na jaki wskazują, jako odnośniki względn
Przykład: jeśli ściągnięty plik /foo/doc.html jest powiązany z z
również ściągniętym, to odnośnik w doc.html zostanie zmieniony ta
na ../bar/img.gif. Ten rodzaj przekształcenia działa bezproblemo
kombinacji katalogów.
· Odnośniki do plików, które nie zostały ściągnięte przez Wget zost
tak, by zawierały nazwę hosta i ścieżkę bezwzględną miejsca, na k
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
30/38
Przykład: jeśli ściągnięty plik /foo/doc.html jest powiązany z z
z ../bar/img.gif), to odnośnik w doc.html zostanie zmieniony tak,
Z tego powodu, przeglądanie lokalne działa niezawodnie: jeśli powiąza
ściągnięty, to odnośnik wskazuje na jego lokalną nazwę, jeśli nie był
adres internetowy, a nie pojawia się popsuty odnośnik. Konwersja pie
odnośników na odnośniki względne zapewnia nam możliwość przesuwania p
hierarchii katalogów do innego katalogu.
Proszę zauważyć, że dopiero na samym końcu pobierania Wget może rozpo
odnośniki zostały ściągnięte. Z tego powodu, opcja -k wykonuje swoją
zakończeniu wszystkich pobrań.
-K
--backup-converted
Podczas konwersji pliku zachowuje kopię zapasową pierwotnej wersji z
.orig. Wpływa na zachowanie opcji -N.
-m
--mirror
Włącza opcje odpowiednie do tworzenia kopii lustrzanych. Ta opcja wł
stosowanie znaczników czasu, ustawia nieograniczony poziom rekurencji
wypisania zawartości katalogów FTP. Obecnie jest równoważna użyciu -
--no-remove-listing.
-p
--page-requisites
Opcja powoduje, że Wget ściągnie wszystkie pliki niezbędne do poprawn
danej strony HTML. Obejmuje to takie rzeczy jak grafikę, dźwięki i p
stylów.
Przy zwykłym trybie pracy, podczas pobierania pojedynczej strony HTML
powiązane dokumenty, które mogą być potrzebne do poprawnego jej wyświ
pobierane. Pomóc może użycie opcji -r z -l, ale ponieważ Wget normaln
dokumentów zewnętrznych od włączonych, na ogół pozostaje się z "oskub
dokumentami", którym brakuje potrzebnych elementów towarzyszących.
Na przykład, powiedzmy, że dokument 1.html zawiera znacznik <IMG> odn
1.gif i znacznik <A> wskazujący na zewnętrzny dokument 2.html. Powied
jest podobny, tyle, że jego obrazkiem jest 2.gif a odnośnik wskazuje
Załóżmy, że kontynuujemy takie zależności aż do jakiejś dowolnie duże
Jeśli wykona się polecenie:
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
31/38
wget -r -l 2 http://I<strona>/1.html
to zostaną pobrane 1.html, 1.gif, 2.html, 2.gif i 3.html. Jak widać,
posiada towarzyszącego mu elementu, gdyż Wget w celu określenia miejs
powinien przerwać rekurencję po prostu zlicza liczbę skoków (aż do 2)
1.html. Jednak przy takim poleceniu:
wget -r -l 2 -p http://I<strona>/1.html
zostaną ściągnięte wszystkie powyższe pliki oraz wymagany przez 3.htm
Podobnie,
wget -r -l 1 -p http://<strona>/1.html
spowoduje pobranie 1.html, 1.gif, 2.html i 2.gif. Można by sądzić, ż
wget -r -l 0 -p http://I<strona>/1.html
pobrałoby tylko 1.html i 1.gif, ale niestety tak nie jest, gdyż -l 0
równoważnikiem -l inf -- czyli nieskończonej rekurencji. Do pobrania
strony HTML (lub ich grupy, wszystkich podanych w wierszu poleceń lub
wejściowym URL-i -i) i towarzyszących jej (lub im) elementów, wystarc
-l:
wget -p http://<strona>/1.html
Proszę zauważyć, że Wget zachowa się tak, jakby podano opcję -r, ale
tylko pojedyncza strona i jej elementy. Program nie będzie podążał za
tej strony do zewnętrznych dokumentów. Faktycznie, do ściągania poje
wszystkich towarzyszących jej elementów (nawet jeśli leżą one na odrę
WWW) i upewnienia się, że całość lokalnie poprawnie się wyświetla, au
korzysta z kilku dodatkowych opcji:
wget -E -H -k -K -p http://<strona>/<dokument>
Kończąc ten temat, warto wiedzieć, że Wget uważa za odnośnik do dokum
każdy URL podany w znaczniku <A>, <AREA> lub <LINK>, oprócz <LINK REL
--strict-comments
Włącza ścisłe przetwarzanie komentarzy HTML. Domyślnie, komentarze są
pierwszym wystąpieniu -->.
Zgodnie ze specyfikacją, komentarze HTML są wyrażone jako deklaracje
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
32/38
jest specjalnym znacznikiem, rozpoczynającym się <! i kończącym się >
...>, która może zawierać dodatkowe komentarze, między parą ograniczn
Komentarze HTML są "pustymi deklaracjami", bez tekstu niebędącego kom
<!--foo--> jest poprawnym komentarzem, jak również <!--one-- --two-->
<!--1--2--> nim nie jest.
Z drugiej strony, większość piszącym HTML nie odczytuje komentarzy ja
innego poza tekstem ograniczonym <!-- i -->, co nie jest tym samym. N
<!------------> jest poprawnym komentarzem o ile liczba minusów jest
czterech (sic!). Jeśli tak nie jest, to ściśle mówiąc komentarz kończ
następnym wystąpieniu --, które może nastąpić np. na końcu dokumentu.
wiele popularnych przeglądarek internetowych całkowicie ignoruje spec
implementuje coś, czego użytkownicy mogą się spodziewać: komentarze o
-->.
Do wersji 1.9 Wget interpretował komentarze w sposób ścisły, co powod
wybrakowanie wielu linków w stronach internetowych wyświetlających si
przeglądarkach, lecz mających nieszczęście w postaci niezgodnych z no
Począwszy od wersji 1.9, Wget dołączył do grona klientów implementują
komentarze, zamykając każdy komentarz po pierwszym wystąpieniu -->.
Jeśli zajdzie potrzeba ścisłego parsowania komentarzy, ta opcja je wł
Opcje rekurencyjnego akceptowania/odrzucania
-A lista-akc --accept lista-akc
-R lista-odrz --reject lista-odrz
Określa oddzieloną przecinkami listę przyrostków lub wzorców nazw pli
odpowiednio, zaakceptowania lub odrzucenia. Proszę pamiętać, że maski
tzn. *, ?, [ lub ], które pojawią się jako element listy-akc lub lis
potraktowane jako wzorzec, a nie przyrostek. W takim przypadku, aby u
rozwinięcia nazwy przez powłokę należy ująć wzorzec w cudzysłowy, jak
"*.mp3" lub -A '*.mp3'.
--accept-regex url-wyr-reg
--reject-regex url-wyr-reg
Określa wyrażenie regularne do zaakceptowania lub odrzucenia całego U
--regex-type typ-wyr-reg
Określa typ wyrażenia regularnego. Dozwolonymi wartościami są posix i
zauważyć, że w celu użycia typu pcre wget musi mieć wkompilowaną obsł
-D lista-domen
--domains=lista-domen
Ustala domeny, do których program może przechodzić. Lista-domen jest
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
33/38
przecinkami. Proszę zauważyć, że ta opcja nie włącza -H.
--exclude-domains lista-domen
Podaje domeny, do których program ma nie przechodzić.
--follow-ftp
Podąża za odnośnikami FTP z dokumentów HTML. Bez tej opcji Wget będz
wszelkie odnośniki do FTP.
--follow-tags=lista
Wget ma wewnętrzną tablicę par: znacznik HTML/atrybut, którą posługuj
poszukiwaniu powiązanych dokumentów podczas pobierania rekurencyjnego
pod uwagę tylko pewien podzbiór tych znaczników, należy użyć tej opcj
postaci listy separowanej przecinkami.
--ignore-tags=lista
Jest to przeciwieństwo opcji --follow-tags. Dzięki podaniu listy roz
przecinkami znaczników HTML można pominąć je podczas rekurencyjnego s
dokumentów do pobrania.
Niegdyś, ta opcja była najlepszym wyborem do ściągania pojedynczej st
elementami, użyta w wierszu poleceń:
wget --ignore-tags=a,area -H -k -K -r
http://<strona>/<dokument>
Jednak autor tej opcji przeszedł przez stronę ze znacznikami typu <LI
HREF="/"> i uświadomił sobie, że -G nie wystarcza. Nie można po pros
ignorowania <LINK>, gdyż wówczas nie będą ściągane arkusze stylów. O
sposobem pobierania pojedynczej strony razem z jej elementami jest sp
przeznaczona do tego opcja --page-requisites.
--ignore-case
Ignoruje wielkość znaków przy dopasowywaniu plików i katalogów. Wpływ
zachowanie opcji -R, -A, -I i -X, podobnie jak przy stosowaniu masek
stron FTP. Na przykład, po zastosowaniu tej opcji -A "*.txt" dopasuje
również plik.TXT, plik3.TxT itd. Cudzysłowy w przykładzie powodują, ż
rozwija wzorca.
-H
--span-hosts
Włącza przechodzenie pomiędzy hostami przy pobieraniu rekurencyjnym.
-L
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
34/38
ŚRODOWISKO
--relative
Podąża tylko za odnośnikami względnymi. Przydatne do pobierania konkr
żadnych odwracających uwagę dodatków, nawet z tego samego hosta.
-I lista
--include-directories=lista
Określa listę rozdzielonych przecinkami katalogów, do których ma prze
podczas pobierania. Elementy listy mogą zawierać znaki uogólniające (
-X lista
--exclude-directories=lista
Określa listę rozdzielonych przecinkami katalogów, które chcemy wyklu
pobierania. Elementy listy mogą zawierać znaki uogólniające (maski).
-np
--no-parent
Powoduje, że Wget przy pobieraniu rekurencyjnym nigdy nie wchodzi do
nadrzędnego. Przydatna opcja, gdyż gwarantuje, że ściągane będą tylk
pewnego poziomu.
Wget obsługuje serwery pośredniczące do pobierań przez HTTP i FTP. Standa
podawania położenia serwera pośredniczącego w przypadku Wgeta, są poniższ
środowiskowe:
http_proxy
https_proxy
Gdy ustawione, zmienne http_proxy i https_proxy powinny zawierać URL-
pośredniczących w, odpowiednio, połączeniach HTTP i HTTPS.
ftp_proxy
Zmienna powinna zawierać URL serwera pośredniczącego w połączeniach F
spotyka się sytuację, gdy http_proxy i ftp_proxy zawierają ten sam UR
no_proxy
Zmienna powinna zawierać listę rozszerzeń domen (separatorem jest prz
których nie będą stosowane serwery pośredniczące. Jeśli na przykład w
wynosi .mit.edu, to serwery pośredniczące nie będą stosowane do pobie
z MIT.
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
35/38
KOD ZAKOŃCZENIA
PLIKI
Domyślne położenie globalnego pliku startowego.
.wgetrc
Plik startowy użytkownika.
BŁĘDY
W przypadku wystąpienia problemów Wget może zwrócić jeden z poniższych ko
0 Nie wystąpiły żadne problemy.
1 Podstawowy kod błędu.
2 Błąd przetwarzania danych -- np. przy przetwarzaniu opcji wiersza pol
lub .netrc...
3 Błąd wejścia/wyjścia pliku.
4 Błąd sieci.
5 Błąd weryfikacji SSL.
6 Błąd uwierzytelnienia nazwy użytkownika/hasła.
7 Błędy protokołów.
8 Serwer zwrócił błędną odpowiedź.
Oprócz kodów 0 i 1, kody zakończenia o mniejszej wartości liczbowej mają
sytuacji, gdy wystąpi wiele typów błędów.
W wersjach Wgeta do 1.12, kody zakończenia były niespójne i niezbyt pomoc
rekurencyjne zawsze zwracały 0 (powodzenie) bez względu na wystąpienie ew
błędów, a nierekurencyjne zwracały zawsze kod zakończenia odpowiadający o
pobierania.
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
36/38
ZOBACZ TAKŻE
Zachęcamy do zamieszczania zgłoszeń błędów dotyczących GNU Wget w systemi
szczegółów pod adresem <
http://wget.addictivecode.org/BugTracker
>).
Przed faktycznym przedłożeniem zgłoszenia błędu, proszę spróbować zastoso
prostych wskazówek.
1. Proszę upewnić się, że obserwowane zachowanie jest rzeczywiście błęde
się wywala, jest to błąd. Jeśli nie zachowuje się zgodnie z dokument
błąd. Jeśli coś działa dziwnie, ale nie ma pewności jak powinno to w
może być to błąd, ale proszę dwa razy sprawdzić dokumentację i listy
2. Proszę spróbować powtórzyć ten błąd w możliwie najprostszych warunkac
Wget pada podczas ściągania wget -rl0 -kKE -t5 -Y0
należy spróbować sprawdzić, czy to wywalanie się jest powtarzalne i c
przy prostszym zestawie opcji. Można nawet spróbować zacząć pobierani
której wystąpiła awaria i sprawdzić, czy to nie ta strona w jakiś spo
Ponadto, choć co prawda prawdopodobnie autor będzie zainteresowany za
.wgetrc użytkownika, zwykłe skopiowanie go do wiadomości o błędzie je
pomysłem. Zamiast tego, należy najpierw sprawdzić, czy błąd powtarza
przeniesionym w inne miejsce. Proszę przesłać odpowiednie fragmenty t
wtedy, gdy okaże się, że błąd zależy od ustawień .wgetrc.
3. Proszę uruchomić Wget z opcją -d i przesłać uzyskany wynik (lub związ
części). Jeśli Wget został skompilowany bez obsługi debugowania, pro
przekompilować. Dużo łatwiej jest śledzić błędy z udostępnioną diagn
Uwaga: proszę upewnić się, że usunęło się wszystkie potencjalnie pryw
dziennika debugowania, przed wysłaniem go na adres zgłoszeń błędów. O
będzie starała się zbierać danych prywatnych, lecz dziennik będzie za
kompletny zapis komunikacji Wgeta z serwerem, co może obejmować także
pobranych danych. Zgłoszenia błędów są archiwizowane publicznie, tak
uznać, że zgłoszenia błędów są również dostępne publicznie.
4. Jeśli Wget się wywala, proszę uruchomić go w debuggerze, np. gdb `wh
wpisać where, by otrzymać stos wywołania (backtrace). Może się to nie
administrator systemu wyłączył pliki core, ale zawsze można spróbować
Nie jest to kompletny podręcznik GNU Wgeta. Więcej informacji, w tym pełn
niektórych opcji oraz wiele poleceń możliwych do zastosowania w plikach .
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
37/38
AUTOR
Pierwotnie napisane przez Hrvojego Nikšicia <
>.
PRAWA AUTORSKIE
TŁUMACZENIE
, file bugs in
© 2018 Canonical Ltd. Ubuntu and Canonical are registered trademarks of Canonical
Ltd.
-e znajduje się we wpisie wget w GNU Info.
Copyright (c) 1996, 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005,
2008, 2009, 2010, 2011 Free Software Foundation, Inc.
Zezwala się na kopiowanie, rozpowszechnianie i/lub modyfikowanie tego dok
warunkach Licencji Wolnej Dokumentacji GNU (GNU Free Documentation Licens
lub jakiejkolwiek nowszej wersji opublikowanej przez Fundację Wolnego Opr
czym Sekcjami niezmiennymi są "GNU General Public License" i "GNU Free Do
License", bez treści przedniej lub tylnej strony okładki. Egzemplarz lic
zamieszczono w sekcji zatytułowanej "GNU Free Documentation License".
Autorami polskiego tłumaczenia niniejszej strony podręcznika man są: Wojt
<
>.
Polskie tłumaczenie jest częścią projektu manpages-pl; uwagi, pomoc, zgła
stronie
http://sourceforge.net/projects/manpages-pl/
oryginału.
12.11.2018
Ubuntu Manpage: wget - nieinteraktywny program do pobierania z sieci
http://manpages.ubuntu.com/manpages/bionic/pl/man1/wget.1.html
38/38