Bygg en nedlastingsplaner med lite programmeringsevner
Vi elsker alle å laste ned ting fra internett, og det finnes massevis av flotte nedlastingsbehandlingverktøy som vi kan bruke til å planlegge nedlastingene våre. Det kan bare være enklere å bruke en nedlastingsbehandling, men det er ingen skade i å utforske verktøyene som allerede kommer med vår Ubuntu og gjøre det fullt ut av det.
I denne artikkelen vil vi vise deg en innebygd programvare i Ubuntu som vi kan bruke til å laste ned ting fra internett ved hjelp av wget. På toppen av det vil vi vise deg hvordan du planlegger nedlastingen ved hjelp av Cron.
Last ned ved hjelp av Wget
Wget er en gratis programvarepakke for å hente filer ved hjelp av HTTP, HTTPS og FTP, de mest brukte Internett-protokollene. Det er et ikke-interaktivt kommandolinjeverktøy, slik at det lett kan kalles fra skript, cron-jobber, terminaler uten X-Windows-støtte, osv..
Åpne terminalen din og la oss utforske hvordan vi kan bruke wget til å laste ned ting fra nettet. Den grunnleggende syntaksen for nedlasting med wget er følgende:
wget [alternativ] ... [URL] ...
Denne kommandoen laster ned wget-håndboken til din lokale stasjon
wget http://www.gnu.org/software/wget/manual/wget.pdf
Linux Cron
Ubuntu kommer med en cron-demon som brukes til å planlegge oppgaver som skal utføres på et bestemt tidspunkt. Crontab lar deg spesifisere handlinger og tider som de skal utføres. Slik planlegger du normalt en oppgave ved hjelp av kommandolinjeværktøjet.
Åpne et terminalvindu og skriv inn crontab -e.
Hver av delene i en crontab er adskilt av et mellomrom, hvor den endelige delen har ett eller flere mellomrom i den. En cronoppføring består av minutt (0-59), time (0-23, 0 = midnatt), dag (1-31), måned (1-12), ukedag (0-6, 0 = søndag), kommando. Den tredje oppføringen i de ovennevnte crontabnedlastingene wget.pdf klokken 2. Den første oppføringen (0) og den andre oppføringen (2) betyr 2:00. Den tredje til den femte oppføringen (*) betyr enhver tid på dagen, måneden eller uken. Den siste oppføringen er wget-kommandoen for å laste ned wget.pdf fra den angitte nettadressen.
Det er grunnen til wget og hvordan Cron fungerer. La oss ta et løp på et ekte eksempel på hvordan du planlegger en nedlasting.
Planlegging Last ned
Vi skal laste ned Firefox 3.6 klokken 2. Siden vår ISP bare gir en begrenset mengde data, må vi stoppe nedlastingen klokka 8.00. Dette er hvordan oppsettet ser ut.
Ignorer de første 2 oppføringene i ovennevnte crontab. Den tredje og fjerde kommandoen er de eneste 2 kommandoene du trenger. Den tredje kommandoen oppsett en oppgave som laster ned Firefox klokken 2:
[kode]
0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=no
[/kode]
C-alternativene angir at wget skal fortsette den eksisterende nedlastingen hvis den ikke er fullført.
Den fjerde kommandoen vil stoppe wget klokken 8.00. 'Killall' er en unix-kommando som dreper prosesser etter navn.
[kode]
0 8 * * * killall wget
[/kode]
Killall wget forteller Ubuntu å stoppe wget fra å laste ned filen ved 8 AM.
Andre nyttige wget-kommandoer
1. Angi katalogen for å laste ned en fil
[kode]
wget -output-document = / home / zainul / Nedlastinger / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
[/kode]
Alternativet -output-dokumentet lar deg spesifisere katalogen og navnet på filen du laster ned
2. Last ned et nettsted
wget er også i stand til å laste ned et nettsted.
[kode]
wget -m http://www.google.com/profiles/zainul.franciscus
[/kode]
Kommandoen ovenfor laster ned hele min google profils webside. Alternativet '-m' forteller wget å laste ned et speilbilde av den angitte nettadressen.
Et annet viktig alternativ er å fortelle wget hvor mange lenker det skal følge når det lastes ned et nettsted.
[kode]
wget -r -l1 http://www.google.com/profiles/zainul.franciscus
[/kode]
Kommandoen ovenfor wget bruker to alternativer. Det første alternativet '-r' forteller wget å laste ned den angitte nettsiden rekursivt. Det andre alternativet '-l1' forteller wget å bare få det første nivået av koblinger fra den angitte nettsiden. Vi kan sette opp til tre nivåer '-l2' og '-l3'.
3. Ignorer robotoppføring
Webmaster opprettholder en tekstfil kalt Robot.txt. 'Robot.txt' opprettholder en liste over nettadresser som en webleserbrowser som wget ikke skal gjennomsøke. Vi kan fortelle wget å ignorere 'Robot.txt' med '-erobots = off' alternativet. Følgende kommando forteller wget å laste ned den første siden av min google-profil og ignorere "Robot.txt.
[kode]
wget -erobots = av http://www.google.com/profiles/zainul.franciscus
[/kode]
Et annet nyttig alternativ er -U. Dette alternativet vil maskere wget som en nettleser. Vær oppmerksom på at maskering av et program som et annet program kan være i strid med begrepet og tjenesten til en nettleverandør.
[kode]
wget -erobots = av -U Mozilla http://www.google.com/profiles/zainul.franciscus
[/kode]
Konklusjon
Wget er en veldig gammel skole, men likevel hackbar GNU-programvarepakke som vi kan bruke til å laste ned filer. Wget er et interaktivt kommandolinjeverktøy som betyr at vi kan la det kjøre på datamaskinen vår i bakgrunnen uten å måtte starte et program. Sjekk ut wget man siden
[kode]
$ mann wget
[/kode]
å forstå andre alternativer som vi kan bruke med wget.
lenker
Wget Manual
Slik kombinerer du to nedlastede filer Når wget mislykkes halvveis
Linux QuickTip: Nedlasting og un-tarring i ett trinn