Wat is het internetarchief en wat kan ik erop vinden?
Weg Terug Machine Internet Held / / April 21, 2021
Laatst geupdate op
Net als een fysieke bibliotheek is het internetarchief waar je heen kunt online om gepubliceerde werken te vinden. In dit geval zijn het echter digitale versies. De maker achter het populaire Wayback-machine, het internetarchief, biedt miljoenen stukjes informatie in meerdere categorieën. Het beste van alles is dat alles wat hier is inbegrepen gratis toegankelijk is.
Wat is het internetarchief?
Het Internet Archive, opgericht in 1996, is een non-profitorganisatie met als missie "universele toegang tot alle kennis". Met dit in gedachten is het organisatie biedt gratis openbare toegang tot gedigitaliseerd materiaal, waaronder webpagina's, boeken, audio-opnamen, inclusief liveconcerten, video's, afbeeldingen en software.
Vanaf april 2021 omvat het:
- 475 miljard webpagina's
- 28 miljoen boeken en teksten
- 14 miljoen audio-opnames (inclusief 220.000 live concerten)
- 6 miljoen video's (inclusief 2 miljoen tv-nieuwsprogramma's)
- 3,5 miljoen afbeeldingen
- 580.000 softwareprogramma's
Alles verzameld door het internetarchief neemt meer dan 70 in beslag Petabytes serverruimte, inclusief twee exemplaren van alles. De organisatie wordt gefinancierd door middel van donaties, beurzen en vergoedingen van diensten voor het digitaliseren van boeken. Voor de privacy houdt het internetarchief de IP-adressen van zijn lezers niet bij en gebruikt het overal het HTTPS-protocol (beveiligd).
Zoeken
Het internetarchief bevat een zoekfunctie centraal op de hoofdpagina. Je ziet ook een veranderende lijst van de topcollecties. Om iets te vinden, voegt u uw zoekterm toe in het daarvoor bestemde vak en klikt u op Ga. U kunt uw zoekopdracht ook beperken tot inhoud en secties.
Secties
Zoals je aan de bovenstaande cijfers kunt zien, is er veel inhoud beschikbaar op archive.org. Zoals de organisatie op haar homepage uitlegt, besteedt ze speciale aandacht aan boeken, omdat niet iedereen toegang heeft tot openbare of academische bibliotheken. De site biedt ook een groeiende selectie video's, waaronder televisie-inhoud, waaronder een tv-nieuwsarchief. Hier is een overzicht van elke sectie.
Web
De Wayback Machine is ongetwijfeld de meest populaire sectie op de Internet Archive-website. Het biedt een digitaal archief van de publieke kant van het web. Op het moment van schrijven heeft het digitale kopieën gemaakt van meer dan 562 miljard webpagina's. Wanneer u de site bezoekt, kunt u elke website doorzoeken die bestaat sinds de Wayback Machine in 2001 online ging. Van daaruit kunt u in de loop van de tijd gecrawlde webpagina's van de site vinden. Bijvoorbeeld een zoekopdracht naar "GroovyPost.com”Levert 2.328 crawls op die teruggaan tot 2007.
De Wayback Machine omvat niet alles wat op een bepaalde dag op een website is geplaatst, aangezien bepaalde inhoud beperkt is of is opgeslagen in databases die niet toegankelijk zijn. Hierdoor worden sommige websites beter gecrawld dan andere, afhankelijk van hoe ontwikkelaars tegelijkertijd een site hebben gemaakt. U zult ook opmerken dat hoe nieuwer het archief is, hoe meer inhoud er beschikbaar is voor een bepaalde site. Hoe dan ook, "teruggaan in de tijd" is een feest en laat je zien hoeveel er de afgelopen decennia is veranderd naarmate het web en de technologie die het in stand houdt, volwassen is geworden.
Boeken en tekst
De collectie tekstarchief biedt een enorme hoeveelheid inhoud die elke week blijft groeien, waaronder 2,3 miljoen moderne eBooks die iedereen kan lenen met een gratis archive.org-account. U kunt naar inhoud zoeken via metagegevens of inhoud, op mediatype, jaar, onderwerp en onderwerpen, en meer. De hoofdpagina van het boekgedeelte bevat ook collecties op basis van weergaven, titel, publicatiedatum en maker.
Al meer dan 15 jaar werkt het internetarchief samen en bouwt het digitale collecties met meer dan 1100 bibliotheekinstellingen, zoals de Boston Public Library, Library of Congress en meer. Dankzij deze partnerschappen konden verschillende mediatypen worden gedigitaliseerd, waaronder microfilm en microfiche, tijdschriften en seriële publicaties. Engels vormt een grote meerderheid van de boeken en teksten die online worden geplaatst. Er is ook inhoud in het Nederlands, Duits, Frans, Arabisch, Italiaans en meer.
Over zijn boeken- en tekstcollectie legt Internet Archive uit: “Omdat we een bibliotheek zijn, besteden we speciale aandacht aan boeken. Niet iedereen heeft toegang tot een openbare of academische bibliotheek met een goede collectie, dus om universele toegang te bieden, hebben we digitale versies van boeken nodig. We zijn in 2005 begonnen met een programma om boeken te digitaliseren, en vandaag scannen we 3.500 boeken per dag op 18 locaties over de hele wereld. Boeken die vóór 1926 zijn gepubliceerd, zijn beschikbaar om te downloaden, en honderdduizenden moderne boeken kunnen worden geleend via onze Open Bibliotheek site. Sommige van onze gedigitaliseerde boeken zijn alleen beschikbaar voor mensen met een afdrukbeperking.”
Video
Het videoarchief is op vrijwel dezelfde manier georganiseerd als de boekencollectie. Er zijn ook speciale collecties die worden georganiseerd rond een evenement, persoon of organisatie. Een speciale sectie bevat op feiten gecontroleerde tv-nieuwsfragmenten van FactCheck.org, PolitiFact, The Washington Post's Fact Checker of andere organisaties. Het bevat ook een downloadbare tabel met feitencontroles georganiseerd op onderwerp, datum en bronnen. Een invloedrijke videocollectie is een nieuwsarchief gewijd aan 11 september 2001 en de gebeurtenissen die daarop volgden. Het bevat gearchiveerde nieuwsprogramma's uit de VS en het buitenland.
Misschien is het steeds groter wordende tv-nieuwsarchief van de site het meest fascinerend. Hier vindt u visualisaties en persinformatie, recente feitencontroles en citaten, trends en aanvullende speciale collecties.
Bent u op zoek naar een specifiek nieuwsprogramma? Het staat vrijwel zeker hier, samen met ondertiteling, tekst en een samenvatting van de onderwerpen van het programma. Sterker nog, de zoekfunctie maakt het mogelijk om specifieke secties in het nieuwsprogramma te vinden.
De videocollectie is echter niet alleen gericht op nieuws. Je vindt er ook animaties en tekenfilms, sportvideo's, films, spirituele programma's, vlogs en nog veel meer.
Audio
Indrukwekkend op zich is de steeds groter wordende audiocollectie. Je vindt er een archief met livemuziek, podcasts, iconische radioprogramma's, 78-toeren per minuut en nog veel meer. Speciale collecties omvatten die gericht op The Grateful Dead, de LibriVox gratis audioboekcollectie en andere.
Software
We hebben een lange weg afgelegd sinds personal computing in de jaren zeventig en tachtig een grote vlucht nam. Onderweg hebben we technologieën zien komen en gaan. Dat is waar de verzameling Internet Archive-software om de hoek komt kijken. Het beschikt over de grootste vintage en historische softwarebibliotheek ter wereld en bevat miljoenen programma's, cd-rom-afbeeldingen, documentatie en multimedia.
De hier gepresenteerde software omvat shareware, freeware, videonieuwsuitgaven over softwaretitels, snelle gameplay, previews en promo's. De speciale softwareverzamelingen klinken als een trip down memory lane, met MS-DOS, emulatie, cd-rom-software en meer.
Misschien is mijn favoriete softwareselectie de Internet Arcade. Het bevat een webgebaseerde bibliotheek met arcade-videogames met muntinworp uit de jaren 70 tot 90. Dankzij emulatie speel je elk spel via een webbrowser.
Afbeeldingen
Ten slotte is er de verzameling afbeeldingen. Vanaf hier vindt u alles, van kaarten tot astronomische beelden tot foto's. Hoogtepunten zijn onder meer een brede verzameling logo's, albumhoezen, inhoud van het Metropolitan Museum of Art, NASA en anderen.
Aanvullende secties
Grotere secties van internetarchief worden genoemd Projecten, en deze maken deel uit van afzonderlijke websites. De meest bekende hiervan is de Wayback Machine, met een webarchief dat teruggaat tot 1996. In totaal zijn er meer dan 200 miljoen websites gearchiveerd in 40 talen.
Naast de Wayback Machine biedt het Internet Archive OpenLibrary.org. De site biedt een gratis, digitale uitleenbibliotheek met meer dan 2 miljoen eBooks, die u online of offline kunt lezen. Als onderdeel van zijn missie is de site ook gewijd aan het bouwen van een webpagina voor elke boek ooit geproduceerd. Tot op heden hebben al meer dan 2 miljoen boeken een pagina op OpenLibrary.org.
Internetarchief: deelname
Ongeacht de sectie is het internetarchief geen plaats voor het grote publiek om historische inhoud te vinden. Met een gratis account kunt u ook media uploaden naar de website. Bovendien werkt de organisatie samen met talloze partners over de hele wereld om kopieën van hun werk op te slaan in speciale collecties.
De site is beschikbaar in elke browser, inclusief Microsoft Edge, Google Chrome, en meer. Er is momenteel geen app voor internetarchief, hoewel u toegang tot de service hebt op iOS- en Android-machines.