Wayback Machine — цифровий архів всесвітньої павутини та іншої інформації в Інтернеті. Його запустила 2001 року неприбуткова організація під назвою Internet Archive, що базується в Сан-Франциско (Каліфорнія, США).
Wayback Machine | |
---|---|
Знімок часового зрізу заархівованих сторінок www.wikipedia.org на сайті Wayback Machine від 21 грудня 2015 року | |
Посилання | web.archive.org |
Тип | Archive |
Реєстрація | Optional |
Мови | англійська |
Власник | Internet Archive |
Автор | Брюстер Кейгл і d |
Започатковано | 24 жовтня 2001 |
Стан | Active |
Рейтинг Alexa | ▼ 253 (February 2019) |
Мова програмування | C, Perl, Java і Python |
Wayback Machine у Вікісховищі |
Історія
2001 року засновники Internet Archive Брюстер Кале і [en] запустили проект Wayback Machine, щоб розв'язати проблему зникнення контенту вебсайтів щоразу, коли їх змінюють або закривають. Сервіс дозволяє користувачам переглядати архівні версії вебсторінок, як вони змінювались з часом, які в архіві називаються «тривимірним індексом». Кале і Джилліат створили сервіс, сподіваючись заархівувати весь інтернет і забезпечити «загальний доступ до всіх знань».
Назву Wayback Machine вибрали як посилання на пристрій для подорожей у часі, який застосовують персонажі [en] і Шерман в анімаційному фільмі [en] під назвою [en]» (вимовляється вей-бек). В одній з частин цього анімаційного мультфільму, [en], персонажі за допомогою машини часу часто стають свідками відомих історичних подій, беруть в них участь і, здебільшого, змінюють їхній перебіг.
У травні 1996 року Wayback Machine почала архівувати кешовані вебсторінки з метою через п'ять років зробити послугу доступною громадськості. Від 1996 до 2001 року інформація зберігалася на магнітних стрічках, а Кале зрідка дозволяв дослідникам і науковцям під'єднуватись до громіздкої бази даних. 2001 року, коли архівові виповнилося п'ять років, відбулась церемонія його відкриття громадськості в Університеті Каліфорнії (Берклі). На час запуску Wayback Machine вона вже містила понад 10 мільярдів архівованих сторінок.
Нині дані зберігаються на великому кластері обчислювальних вузлів Linux компанії Internet Archive. Він час від часу заново відвідує і архівує нові версії вебсайтів (див. технічні дані нижче). Сторінки також можна архівувати вручну, вводячи їх URL-адреси в поле пошуку, за умови, що вебсайти дозволяють пошуковому роботу Wayback Machine просканувати їх і зберегти дані.
Технічні деталі
Wayback Machine за допомогою спеціального пошукового робота сканує Інтернет і завантажує всі загальнодоступні вебсторінки, ієрархію Gopher, електронну дошку оголошень Usenet, а також завантажуване програмне забезпечення. Ці роботи можуть відсканувати не всю доступну в Інтернеті інформацію, оскільки доступ до значної частини даних обмежують власники сайтів, або ж ці дані зберігається в недоступних базах даних. Щоб подолати неузгодженості частково кешованих вебсайтів, 2005 року компанія Internet Archive створила сайт Archive-It.org як засіб, що дозволяє установам і творцям контенту за власним бажанням збирати і зберігати зібрання цифрового контенту та створювати цифрові архіви.
Сканування надходять з різних джерел. Деякі імпортуються від третіх сторін, тоді як інші генеруються всередині самого Архіву. Наприклад, сканування надходять від Фундації Альфреда Слоуна і Alexa, сканування зроблені ІА для Національного управління архівів та документації та [en], дзеркал [en]. «Worldwide Web Crawls» працює з 2010 року і сканує всемережжя.
Частота зроблених знімків сторінок змінюється в залежності від вебсайту. Сайти у «Worldwide Web Crawls» вміщені в «список сканувань». Один сайт архівується раз за сканування. Сканування може тривати кілька місяців або навіть років у залежності від розміру. Наприклад, «Wide Crawl Number 13» розпочався 9 січня 2015 року й завершився 11 липня 2016 року. Однак, в один і той самий час може відбуватись кілька сканувань, і сайт може бути вміщено в понад один список сканувань, тож частота сканування сайтів змінюється в широких межах.
Місткість сховища та її зростання
Разом з розвитком технології впродовж років зростала й місткість сховища Wayback Machine. У 2003 році, через два роки після того, як доступ став публічним, Wayback Machine зростала зі швидкістю 12 терабайтів на місяць. Дані зберігаються на зробленій на замовлення системі стелажування [en], розробленій співробітниками інтернет-архіву. Перший стелаж на 100ТВ повністю увійшов у дію в червні 2004 року, хоча невдовзі стало зрозуміло, що потрібно значно більше обсягу пам'яті, ніж він має.
2009 року Internet Archive перевів свою спеціалізовану архітектуру зберігання до [en], і має у своїй власності новий центр обробки даних у [en] у каліфорнійському кампусі Sun Microsystems. Станом на 2009 Wayback Machine містила приблизно три петабайти даних і зростала зі швидкістю 100 терабайт на місяць.
Нова, поліпшена версія Wayback Machine, з оновленим інтерфейсом і новішим покажчиком архівних матеріалів, стала доступною для публічного тестування у 2011 році. У березні того самого року на форумі Wayback Machine було сказано, що «бета-версія нової Wayback Machine має повніший і актуальніший покажчик всіх відсканованих матеріалів до 2010 року, й продовжить регулярно оновлюватися. Покажчик, який управляв старою Wayback Machine, має небагато матеріалів після 2008 року, і жодних його подальших оновлень не планується, оскільки цього року його припинять використовувати». Також 2011 року інтернет-архів встановив свою шосту пару стелажів PetaBox, що дозволило збільшити місткість Wayback Machine на 700 терабайт.
У січні 2013 року Internet Archive оголосила про нову віху — 240 мільярдів відсканованих URL-адрес. У жовтні 2013 року компанія оголосила про введення функції «Save a Page», що дозволяє користувачам Інтернету заархівувати вміст URL-адреси і швидко створює на відміну від попередньої функції liveweb. Це стало загрозою зловживань з боку сервісу як [en].
Станом на грудень 2014 Wayback Machine містила 435 мільярдів вебсторінок обсягом майже дев'ять петабайтів, і зростала приблизно на 20 терабайтів щотижня.
Станом на липень 2016 Wayback Machine містила близько 15 петабайт даних.
Станом на вересень 2018 року Wayback Machine містила понад 25 петабайтів даних.
Станом на грудень 2020 року Wayback Machine містила понад 70 петабайтів даних.
Зростання
За період з жовтня 2013 року по березень 2015 року в глобальному рейтингу Alexa сайт Wayback Machine опустився зі 163-го на 208-ме місце. У березні 2019 сайт був на 244-му місці.
Рік | Кількість заархівованих сторінок (мільярдів) |
---|---|
2005 | 40 |
2008 | 85 |
2012 | 150 |
2013 | 373 |
2014 | 400 |
2015 | 452 |
Політики винятків вебсайтів
Історично, Wayback Machine поважав стандарт винятків для роботів (Robots.txt), визначаючи коли сайт можна сканувати; або ж, якщо вже робот його обійшов, чи ці архіви будуть у відкритому доступі. Власники вебсайту мають можливість зробити його недоступним для Wayback Machine за допомогою robots.txt. Правила robots.txt застосовуються заднім числом; якщо власник сайту заблокував для інтернет-архіву доступ до нього, то всі заархівовані раніше сторінки з цього домену також одразу ж стають недоступними. Крім того, працівники Internet Archive заявили, що «іноді власник сайту зв'язується з нами і просить зупинити сканування та архівацію сайту. Ми виконуємо ці запити». Крім того, на сайті написано: «Internet Archive не зацікавлений у скануванні вебсайту та інших інтернет-документів, або наданні доступу до них, якщо власники не хочуть, щоб вони були в зібранні».
Оклендська архівна політика
Політика винятку заднім числом Wayback Machine частково ґрунтується на рекомендаціях з управління запитами на вилучення і збереження архівної цілісності (англ. Recommendations for Managing Removal Requests and Preserving Archival Integrity), опублікованих в Університеті Каліфорнії (Берклі) у 2002 році, які дають власникові сайту право заблокувати доступ до архіву сайту. Wayback дотримується цієї політики, щоб за можливості уникнути дорогих судових розглядів.
Політика винятку заднім числом Wayback почала послаблюватися 2017 року, коли він перестав зважати на файли robots.txt на американських урядових і військових вебсайтах як для їх сканування, так і показу відсканованих вебсторінок. Станом на квітень 2017 Wayback ігнорує robots.txt в ширших межах, не тільки для урядових сайтів США.
Використання
Від 2001 року, коли Wayback Machine стала доступною громадськості, науковці вивчали як способи, якими вона зберігає і збирає дані, так і самі сторінки, що вже містяться в її архіві. Станом на 2013 рік науковці написали близько 350 статей про Wayback Machine, здебільшого в галузях інформаційних технологій, бібліотекознавства та суспільних наук. Представники суспільних наук скористалися Wayback Machine, щоб проаналізувати, як розвиток вебсайтів, починаючи з середини 1990-х років і дотепер вплинув на темпи зростання компаній.
Коли Wayback Machine архівує сторінку, вона зазвичай вміщує більшість гіперпосилань, зберігаючи ці посилання активними, коли вони запросто могли бути порушені нестабільністю Інтернету. Індійські вчені вивчали здатність Wayback Machine зберігати гіперпосилання в наукових онлайн-публікаціях і визначили, що вона зберігає трохи більш як половину з них.
Журналісти використовують Wayback Machine, щоб переглядати мертві сайти, застарілі новини і зміни в змісті сайту. Його зміст використовують, щоб притягати політиків до відповідальності й викривати брехню в зображенні подій на полі бою. 2014 року заархівована з соціальної мережі сторінка Ігоря Гіркина засвідчила, як він хвалиться, що його бійці збили нібито український військовий літак. Коли ж стало відомо, що насправді це цивільний літак Малайзійських авіаліній, Гіркін видалив пост і звинуватив українських військових у знищенні літака. Марш за науку в березні 2017 року розпочався з обговорення на Reddit, яке показало, що хтось відвідав Archive.org і виявив, що з сайту Білого дому вилучено всі посилання на зміну клімату. У відповідь один з користувачів написав: «Має бути хода науковців на Вашингтон».
Крім того, сайт активно використовується для верифікації, забезпечуючи редакторам Вікіпедії доступ до посилань і можливість створювати контент.
Обмеження
Попри свої можливості, Wayback Machine також має деякі обмеження. У 2014 році затримка між скануванням вмісту сайтів і часом, коли він був доступним на Wayback Machine, становила шість місяців. Станом на листопад 2018 року час затримки становив від 3 до 10 годин. Wayback Machine не є «історичним Google»; користувачі самі мають знати URL-адреси вебсайтів, які вони хочуть переглянути. Існує функція «Site Search» (пошук сайту), яка дозволяє користувачам знайти сайт на основі слів, що описують сайт, а не слів, знайдених на самих вебсторінках.
Wayback Machine не містить усіх сторінок, коли-небудь створених, через обмеження свого . Wayback Machine не може повністю архівувати вебсторінки, які містять інтерактивні функції, як-от Флеш-платформи і форми, написані на JavaScript, бо ці функції вимагають взаємодії з хост-сайтом. Вебкраулеру складно відсканувати все, що закодовано не в HTML (або одному з його варіантів), що часто призводить до зламаних гіперпосилань та відсутніх зображень. Через це вебкраулер не архівує «сторінок-сиріт», які не містять посилань на інші сторінки. Краулер Wayback Machine може відсканувати лише наперед визначену кількість гіперпосилань, згідно з наперед заданим обмеженням глибини, тому він не може заархівувати всі гіперпосилання на кожній сторінці.
Деякі власники поміщають на свій сайт файл robots.txt, який не дозволяє Wayback Machine знаходити та архівувати їх. Крім того, власники вебсайтів також можуть безпосередньо зв'язатися з Інтернет-архівом і просити, щоб їх сторінки було вилучено з архіву.
Як юридичні докази
Цивільне судочинство
Netbula LLC проти Chordiant Software Inc.
У справі 2009 року Netbula, LLC проти Chordiant Software Inc відповідач Chordiant подав клопотання, щоб Netbula на своєму сайті вимкнула файл robots.txt, який змушував Wayback Machine заднім числом закривати доступ до попередніх версій сторінок, заархівованих з сайту Netbula, які, на думку Chordiant могли б свідчити на користь захисту.
Netbula заперечила проти цього клопотання на тій підставі, що відповідач звертався з проханням змінити сайт Netbula, а йому слід було безпосередньо зробити запит до Інтернет-архіву за доступом до заархівованих сторінок. Проте, співробітник Internet Archive подав заяву під присягою, в якій підтримав дію Chordiant, заявивши, що він не може видати вебсторінки за допомогою інших засобів «без значного навантаження, витрат і перебоїв у його роботі».
Суддя Говард Ллойд у Північному окрузі Каліфорнії, відділі Сан-Хосе, відхилив заперечення Netbula і наказав йому тимчасово вимкнути блокування robots.txt для того, щоб Chordiant отримав архівні сторінки.
Telewizja Polska
У жовтні 2004 року у справі Telewizja Polska USA, Inc. проти Echostar Satellite, No. 02 °C 3293, 65 Fed. R. Evid. Serv. 673 (N.D. Ill. October 15, 2004) позивач, мабуть вперше в історії, намагався використати Wayback Machine як джерело допустимих доказів. Компанія Telewizja Polska є провайдером TVP Polonia і [en], яка управляє Dish Network. До початку судового розгляду EchoStar вказала, що має намір запропонувати знімки Wayback Machine як доказ минулого змісту сайту Telewizja Polska. Компанія Telewizja Polska подала [en], щоб завадити використанню знімків на тій підставі, що нібито це чутки і неперевірене джерело, але суддя Арландер, відхилив твердження Telewizja Polska, що нібито це чутки, й відмовив у клопотанні про нерозголошення щодо вилучення доказів з процесу.
Патентне право
За умови виконання деяких додаткових вимог (наприклад, надання авторитетної заяви архівіста), [en] і [en] приймають від Інтернет-архіву відмітки часу як доказ того, коли ця вебсторінка була доступна громадськості. Ці дані використовуються для визначення, чи вебсторінку можна вважати prior art, наприклад, під час розгляду заявки на патент.
Цензура та інші загрози
Станом на грудень 2016 року Archive.org [en].
Елісон Макріна, директорка Library Freedom Project, зазначає, що «хоча бібліотекарі глибоко цінують недоторканість приватного життя, ми також рішуче виступаємо проти цензури».
Відомі окремі випадки, коли сайт закрив онлайн-доступ до матеріалів, через які «випадкові» люди опинились у небезпеці.
Серед інших загроз: стихійні лиха, знищення (дистанційне або фізичне), маніпуляція вмістом архіву (див. також: хакерська атака, резервне копіювання), проблематичне авторське право і спостереження за користувачами сайту.
Кевін Воен підозрює, що в довгостроковій перспективі багатьох поколінь «майже нічого» не залишиться такого, щоб цим можна було практично скористатись, але «якщо збережеться наступність нашої технологічної цивілізації», то «значну частину голих даних можна буде знайти й дослідити».
Власники Інтернет-архіву заявляють, що він побудований з розрахунком на тривалу перспективу. Втім, автори статті у журналі The Atlantic описують його роботу як "несамовите намагання вихопити дані перш ніж вони зникнуть, не маючи для цього якоїсь більш-менш надійної тривалої інфраструктури.
Див. також
- Колективна пам'ять
- [en]
- Глибинна мережа
- [en]
- Library Genesis
- [en]
- Вебархівування
- WebCite
- Archive.is
Примітки
- . WHOIS. Архів оригіналу за 14 травня 2020. Процитовано 13 березня 2016.
- . WHOIS. Архів оригіналу за 12 травня 2020. Процитовано 13 березня 2016.
- . alexa.com. Архів оригіналу за 23 березня 2019. Процитовано 4 лютого 2019.
- Notess, Greg R. (March–April 2002). The Wayback Machine: The Web's Archive. Online. 26: 59—61 — через EBSCOhost.
- The Wayback Machine, Frequently Asked Questions, оригіналу за 18 вересня 2018, процитовано 18 вересня 2018
- 20,000 Hard Drives on a Mission | Internet Archive Blogs. blog.archive.org (англ.). оригіналу за 20 жовтня 2018. Процитовано 15 жовтня 2018.
- Green, Heather (28 лютого 2002). . BusinessWeek. Архів оригіналу за 20 грудня 2011.
- Tong, Judy (8 вересня 2002). Responsible Party – Brewster Kahle; A Library Of the Web, On the Web. New York Times. оригіналу за 20 лютого 2011. Процитовано 15 серпня 2011.
- Internet Archive: Wayback Machine. archive.org (англ.). оригіналу за 3 січня 2014. Процитовано 15 жовтня 2018.
- Cook, John (1 листопада 2001). Web site takes you way back in Internet history. Seattle Post-Intelligencer. оригіналу за 12 серпня 2014. Процитовано 15 серпня 2011.
- Wayback Goes Way Back on Web. Wired. 28 жовтня 2001. оригіналу за 16 жовтня 2017. Процитовано 16 жовтня 2017.
- Arora, Sanjay K.; Li, Yin; Youtie, Jan; Shapira, Philip (5 травня 2015). Using the wayback machine to mine websites in the social sciences: A methodological resource. Journal of the Association for Information Science and Technology (англ.). 67 (8): 1904—1915. doi:10.1002/asi.23503. ISSN 2330-1635.
- Kalev Leetaru (28 січня 2016). The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web. Forbes. оригіналу за 16 жовтня 2017. Процитовано 16 жовтня 2017.
- Kahle, Brewster. Archiving the Internet. Scientific American – March 1997 Issue. оригіналу за 3 квітня 2012. Процитовано 19 серпня 2011.
- Jeff Kaplan (27 жовтня 2014). Archive-It: Crawling the Web Together. Internet Archive Blogs. оригіналу за 12 жовтня 2017. Процитовано 16 жовтня 2017.
- Worldwide Web Crawls. Internet Archive. оригіналу за 19 жовтня 2017. Процитовано 16 жовтня 2017.
- Wide Crawl Number 13. Internet Archive. оригіналу за 19 жовтня 2017. Процитовано 16 жовтня 2017.
- Internet Archive: Petabox. archive.org (англ.). Процитовано 25 жовтня 2018.
- Kanellos, Michael (29 липня 2005). . CNET News.com. Архів оригіналу за 3 квітня 2007. Процитовано 29 липня 2007.
- Internet Archive and Sun Microsystems Create Living History of the Internet. Sun Microsystems. 25 березня 2009. оригіналу за 26 березня 2009. Процитовано 27 березня 2009.
- Mearian, Lucas (19 березня 2009). . Computerworld.com. Архів оригіналу за 23 березня 2009. Процитовано 22 березня 2009.
- Updated Wayback Machine in Beta Testing. Archive.org. оригіналу за 23 серпня 2011. Процитовано 19 серпня 2011.
- Beta Wayback Machine, in forum. Archive.org. оригіналу за 17 квітня 2014. Процитовано 16 квітня 2014.
- Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used. archive.org (англ.). оригіналу за 24 жовтня 2016. Процитовано 25 жовтня 2018.
- Wayback Machine: Now with 240,000,000,000 URLs | Internet Archive Blogs. Blog.archive.org. 9 січня 2013. оригіналу за 14 квітня 2014. Процитовано 16 квітня 2014.
- Rossi, Alexis (25 жовтня 2013). Fixing Broken Links on the Internet. archive.org. San Francisco, CA, US: Collections Team, the Internet Archive. оригіналу за 7 листопада 2014. Процитовано 25 березня 2015.
We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.
- The VirusTotal Team (25 березня 2015). 207.241.226.190 IP address information. virustotal.com. Dublin 2, Ireland: VirusTotal. оригіналу за 14 липня 2014. Процитовано 25 березня 2015.
2015-03-25: Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset. ... 2/62 2015-03-25 16:14:12 [complete URL redacted]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [complete URL redacted]/CBLightSetup.exe
- Advisory provided by Google (25 березня 2015). Safe Browsing Diagnostic page for archive.org. google.com/safebrowsing. Mountain View, CA, US: Google. оригіналу за 6 квітня 2015. Процитовано 25 березня 2015.
2015-03-25: Part of this site was listed for suspicious activity 138 time(s) over the past 90 days. ... What happened when Google visited this site? ... Of the 42410 pages we tested on the site over the past 90 days, 450 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2015-03-25, and the last time suspicious content was found on this site was on 2015-03-25. ... Malicious software includes 169 trojan(s), 126 virus, 43 backdoor(s).
- Internet Archive Frequently Asked Questions. оригіналу за 21 жовтня 2009. Процитовано 17 січня 2015.
- . 18 грудня 2014. Архів оригіналу за 18 грудня 2014. Процитовано 13 грудня 2018.
- Can the manipulation of big data change the way the world thinks?. The National. оригіналу за 12 січня 2017. Процитовано 14 травня 2017.
- Crockett, Zachary (28 вересня 2018). Inside Wayback Machine, the internet’s time capsule. The Hustle (амер.). оригіналу за 2 жовтня 2018. Процитовано 26 жовтня 2018.
- Heffernan, Virginia (18 вересня 2018). Things Break and Decay on the Internet—That's a Good Thing. WIRED (англ.). оригіналу за 25 вересня 2018. Процитовано 26 жовтня 2018.
- . adafruit. Архів оригіналу за 2 грудня 2020. Процитовано 2 грудня 2020.
- . Alexa Internet. Архів оригіналу за 28 жовтня 2013. Процитовано 29 жовтня 2013.
- . Alexa Internet. Архів оригіналу за 9 квітня 2015. Процитовано 9 квітня 2015.
- . web.archive.org. 23 березня 2019. Архів оригіналу за 23 березня 2019. Процитовано 5 квітня 2019.
- michelle (9 травня 2014). Wayback Machine Hits 400,000,000,000!. Internet Archive. оригіналу за 26 серпня 2014. Процитовано 25 березня 2015.
- . Internet Archive. Архів оригіналу за 13 лютого 2015. Процитовано 25 березня 2015.
- Some sites are not available because of Robots.txt or other exclusions [ 15 квітня 2011 у Wayback Machine.]
- How can I remove my site's pages from the Wayback Machine? [ 17 квітня 2014 у Wayback Machine.]
- Cox, Joseph (22 травня 2018). The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers. Архів оригіналу за 23 травня 2018. Процитовано 23 травня 2018.
- Recommendations for Managing Removal Requests And Preserving Archival Integrity. University of California. 14 грудня 2002. оригіналу за 18 вересня 2017. Процитовано 14 вересня 2017.
- Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy. Internet Archive. 7 липня 2014. оригіналу за 10 жовтня 2017. Процитовано 14 вересня 2017.
- Mark Graham (17 квітня 2017). Robots.txt meant for search engines don't work well for web archives. Internet Archive Blogs. оригіналу за 17 квітня 2017. Процитовано 16 квітня 2017.
- Archivierung des Internets: Internet Archive ignoriert künftig robots.txt (нім.). heise online. оригіналу за 27 квітня 2017. Процитовано 14 травня 2017.
- Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de (нім.). оригіналу за 19 червня 2017. Процитовано 14 травня 2017.
- Internet Archive will ignore robots.txt files to keep historical record accurate. Digital Trends. 24 квітня 2017. оригіналу за 16 травня 2017. Процитовано 14 травня 2017.
- Sampath Kumar, B.T.; Prithviraj, K.R. (21 жовтня 2014). Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs. Journal of Information Science (англ.). 41 (1): 71—81. doi:10.1177/0165551514552752. ISSN 0165-5515.
- Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed. оригіналу за 6 січня 2017. Процитовано 14 травня 2017.
- What the Web Said Yesterday. The New Yorker. оригіналу за 25 січня 2015. Процитовано 14 травня 2017.
- The March for Science began with this person's 'throwaway line' on Reddit. Washington Post. оригіналу за 23 квітня 2017. Процитовано 23 квітня 2017.
- Are scientists going to march on Washington?. The Washington Post. оригіналу за 31 січня 2017. Процитовано 31 січня 2017.
- Foley, Katherine Ellen. The global March for Science started with a single Reddit thread. Quartz. оригіналу за 24 квітня 2017. Процитовано 23 квітня 2017.
- http://blog.archive.org/2018/10/01/more-than-9-million-broken-links-on-wikipedia-are-now-rescued
- . Internet Archive. 2 квітня 2014. Архів оригіналу за 2 квітня 2014. Процитовано 23 листопада 2018.
- Internet Archive Frequently Asked Questions. archive.org (англ.). Процитовано 23 листопада 2018.
- Bates, Mary Ellen (2002). The Wayback Machine. Online. 26: 80 — через EBSCOhost.
- Internet Archive Frequently Asked Questions. archive.org (англ.). оригіналу за 20 квітня 2013. Процитовано 18 жовтня 2018.
- Lloyd, Howard (October 2009). (PDF). Архів оригіналу (PDF) за 8 серпня 2019. Процитовано 15 жовтня 2009.
- Cortes, Antonio (October 2009). . Архів оригіналу за жовтень 27, 2010. Процитовано 15 жовтня 2009.
- Gelman, Lauren (17 листопада 2004). Internet Archive's Web Page Snapshots Held Admissible as Evidence. Packets. 2 (3). оригіналу за 30 квітня 2011. Процитовано 4 січня 2007.
- Howell, Beryl A. (February 2006). (PDF). Journal of Internet Law: 3—9. Архів оригіналу (PDF) за 5 липня 2010. Процитовано 6 серпня 2008.
- Wynn W. Coggins (Fall 2002). Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes?. USPTO. оригіналу за 21 вересня 2012.
- Conger, Kate. Backing up the history of the internet in Canada to save it from Trump. TechCrunch. оригіналу за 27 грудня 2016. Процитовано 14 травня 2017.
- Where to find what's disappeared online, and a whole lot more: the Internet Archive. Public Radio International. оригіналу за 28 березня 2017. Процитовано 14 травня 2017.
- Help Us Keep the Archive Free, Accessible, and Reader Private | Internet Archive Blogs. оригіналу за 21 травня 2017. Процитовано 14 травня 2017.
- Internet Archive: Proposed Changes To DMCA Would Make Us "Censor The Web". Consumerist. 7 червня 2016. оригіналу за 11 листопада 2016. Процитовано 14 травня 2017.
- Herb, Ulrich. Die Trump-Angst grassiert (нім.). heise online. оригіналу за 7 грудня 2016. Процитовано 14 травня 2017.
- LaFrance, Adrienne. The Internet's Dark Ages. The Atlantic. оригіналу за 7 травня 2017. Процитовано 14 травня 2017.
- The Entire Internet Will Be Archived In Canada to Protect It From Trump (en-us) . Motherboard. оригіналу за 16 травня 2017. Процитовано 14 травня 2017.
- LaFrance, Adrienne. The Human Fear of Total Knowledge. The Atlantic. оригіналу за 2 грудня 2016. Процитовано 14 травня 2017.
Посилання
- Офіційний сайт
- Terms of use, privacy and copyright policy. archive.org. 31 грудня 2014.
- . .com (англ.) (нім.) (ісп.) (фр.) (італ.). Архів оригіналу за 15 березня 2020. Процитовано 20 квітня 2019.
- Internet history is fragile. This archive is making sure it doesn’t disappear. [ 8 квітня 2021 у Wayback Machine.]
Дзеркала
- Official mirror of the Wayback Machine. Архів оригіналу за 28 листопада 2012. Процитовано 20 квітня 2019.
Утиліти
- . sourceforge.net. Архів оригіналу за 16 вересня 2011. Процитовано 20 квітня 2019. (за IIPC)
- . github.com. Архів оригіналу за 3 травня 2021. Процитовано 20 квітня 2019.
- (англ.) (пол.). Архів оригіналу за 21 березня 2018. Процитовано 20 квітня 2019.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Wayback Machine cifrovij arhiv vsesvitnoyi pavutini ta inshoyi informaciyi v Interneti Jogo zapustila 2001 roku nepributkova organizaciya pid nazvoyu Internet Archive sho bazuyetsya v San Francisko Kaliforniya SShA Wayback MachineLogotipZnimok chasovogo zrizu zaarhivovanih storinok www wikipedia org na sajti Wayback Machine vid 21 grudnya 2015 rokuPosilannya web archive orgTip ArchiveReyestraciya OptionalMovi anglijskaVlasnik Internet ArchiveAvtor Bryuster Kejgl i dZapochatkovano 24 zhovtnya 2001 22 roki tomu 2001 10 24 Stan ActiveRejting Alexa 253 February 2019 Mova programuvannya C Perl Java i Python Wayback Machine u VikishovishiIstoriya2001 roku zasnovniki Internet Archive Bryuster Kale i en zapustili proekt Wayback Machine shob rozv yazati problemu zniknennya kontentu vebsajtiv shorazu koli yih zminyuyut abo zakrivayut Servis dozvolyaye koristuvacham pereglyadati arhivni versiyi vebstorinok yak voni zminyuvalis z chasom yaki v arhivi nazivayutsya trivimirnim indeksom Kale i Dzhilliat stvorili servis spodivayuchis zaarhivuvati ves internet i zabezpechiti zagalnij dostup do vsih znan Nazvu Wayback Machine vibrali yak posilannya na pristrij dlya podorozhej u chasi yakij zastosovuyut personazhi en i Sherman v animacijnomu filmi en pid nazvoyu en vimovlyayetsya vej bek V odnij z chastin cogo animacijnogo multfilmu en personazhi za dopomogoyu mashini chasu chasto stayut svidkami vidomih istorichnih podij berut v nih uchast i zdebilshogo zminyuyut yihnij perebig U travni 1996 roku Wayback Machine pochala arhivuvati keshovani vebstorinki z metoyu cherez p yat rokiv zrobiti poslugu dostupnoyu gromadskosti Vid 1996 do 2001 roku informaciya zberigalasya na magnitnih strichkah a Kale zridka dozvolyav doslidnikam i naukovcyam pid yednuvatis do gromizdkoyi bazi danih 2001 roku koli arhivovi vipovnilosya p yat rokiv vidbulas ceremoniya jogo vidkrittya gromadskosti v Universiteti Kaliforniyi Berkli Na chas zapusku Wayback Machine vona vzhe mistila ponad 10 milyardiv arhivovanih storinok Nini dani zberigayutsya na velikomu klasteri obchislyuvalnih vuzliv Linux kompaniyi Internet Archive Vin chas vid chasu zanovo vidviduye i arhivuye novi versiyi vebsajtiv div tehnichni dani nizhche Storinki takozh mozhna arhivuvati vruchnu vvodyachi yih URL adresi v pole poshuku za umovi sho vebsajti dozvolyayut poshukovomu robotu Wayback Machine proskanuvati yih i zberegti dani Tehnichni detaliWayback Machine za dopomogoyu specialnogo poshukovogo robota skanuye Internet i zavantazhuye vsi zagalnodostupni vebstorinki iyerarhiyu Gopher elektronnu doshku ogoloshen Usenet a takozh zavantazhuvane programne zabezpechennya Ci roboti mozhut vidskanuvati ne vsyu dostupnu v Interneti informaciyu oskilki dostup do znachnoyi chastini danih obmezhuyut vlasniki sajtiv abo zh ci dani zberigayetsya v nedostupnih bazah danih Shob podolati neuzgodzhenosti chastkovo keshovanih vebsajtiv 2005 roku kompaniya Internet Archive stvorila sajt Archive It org yak zasib sho dozvolyaye ustanovam i tvorcyam kontentu za vlasnim bazhannyam zbirati i zberigati zibrannya cifrovogo kontentu ta stvoryuvati cifrovi arhivi Skanuvannya nadhodyat z riznih dzherel Deyaki importuyutsya vid tretih storin todi yak inshi generuyutsya vseredini samogo Arhivu Napriklad skanuvannya nadhodyat vid Fundaciyi Alfreda Slouna i Alexa skanuvannya zrobleni IA dlya Nacionalnogo upravlinnya arhiviv ta dokumentaciyi ta en dzerkal en Worldwide Web Crawls pracyuye z 2010 roku i skanuye vsemerezhzhya Chastota zroblenih znimkiv storinok zminyuyetsya v zalezhnosti vid vebsajtu Sajti u Worldwide Web Crawls vmisheni v spisok skanuvan Odin sajt arhivuyetsya raz za skanuvannya Skanuvannya mozhe trivati kilka misyaciv abo navit rokiv u zalezhnosti vid rozmiru Napriklad Wide Crawl Number 13 rozpochavsya 9 sichnya 2015 roku j zavershivsya 11 lipnya 2016 roku Odnak v odin i toj samij chas mozhe vidbuvatis kilka skanuvan i sajt mozhe buti vmisheno v ponad odin spisok skanuvan tozh chastota skanuvannya sajtiv zminyuyetsya v shirokih mezhah Mistkist shovisha ta yiyi zrostannya Razom z rozvitkom tehnologiyi vprodovzh rokiv zrostala j mistkist shovisha Wayback Machine U 2003 roci cherez dva roki pislya togo yak dostup stav publichnim Wayback Machine zrostala zi shvidkistyu 12 terabajtiv na misyac Dani zberigayutsya na zroblenij na zamovlennya sistemi stelazhuvannya en rozroblenij spivrobitnikami internet arhivu Pershij stelazh na 100TV povnistyu uvijshov u diyu v chervni 2004 roku hocha nevdovzi stalo zrozumilo sho potribno znachno bilshe obsyagu pam yati nizh vin maye 2009 roku Internet Archive pereviv svoyu specializovanu arhitekturu zberigannya do en i maye u svoyij vlasnosti novij centr obrobki danih u en u kalifornijskomu kampusi Sun Microsystems Stanom na 2009 Wayback Machine mistila priblizno tri petabajti danih i zrostala zi shvidkistyu 100 terabajt na misyac Nova polipshena versiya Wayback Machine z onovlenim interfejsom i novishim pokazhchikom arhivnih materialiv stala dostupnoyu dlya publichnogo testuvannya u 2011 roci U berezni togo samogo roku na forumi Wayback Machine bulo skazano sho beta versiya novoyi Wayback Machine maye povnishij i aktualnishij pokazhchik vsih vidskanovanih materialiv do 2010 roku j prodovzhit regulyarno onovlyuvatisya Pokazhchik yakij upravlyav staroyu Wayback Machine maye nebagato materialiv pislya 2008 roku i zhodnih jogo podalshih onovlen ne planuyetsya oskilki cogo roku jogo pripinyat vikoristovuvati Takozh 2011 roku internet arhiv vstanoviv svoyu shostu paru stelazhiv PetaBox sho dozvolilo zbilshiti mistkist Wayback Machine na 700 terabajt U sichni 2013 roku Internet Archive ogolosila pro novu vihu 240 milyardiv vidskanovanih URL adres U zhovtni 2013 roku kompaniya ogolosila pro vvedennya funkciyi Save a Page sho dozvolyaye koristuvacham Internetu zaarhivuvati vmist URL adresi i shvidko stvoryuye na vidminu vid poperednoyi funkciyi liveweb Ce stalo zagrozoyu zlovzhivan z boku servisu yak en Stanom na gruden 2014 Wayback Machine mistila 435 milyardiv vebstorinok obsyagom majzhe dev yat petabajtiv i zrostala priblizno na 20 terabajtiv shotizhnya Stanom na lipen 2016 Wayback Machine mistila blizko 15 petabajt danih Stanom na veresen 2018 roku Wayback Machine mistila ponad 25 petabajtiv danih Stanom na gruden 2020 roku Wayback Machine mistila ponad 70 petabajtiv danih Zrostannya Za period z zhovtnya 2013 roku po berezen 2015 roku v globalnomu rejtingu Alexa sajt Wayback Machine opustivsya zi 163 go na 208 me misce U berezni 2019 sajt buv na 244 mu misci Zrostannya Wayback Machine Rik Kilkist zaarhivovanih storinok milyardiv 2005 402008 852012 1502013 3732014 4002015 452Politiki vinyatkiv vebsajtiv Istorichno Wayback Machine povazhav standart vinyatkiv dlya robotiv Robots txt viznachayuchi koli sajt mozhna skanuvati abo zh yaksho vzhe robot jogo obijshov chi ci arhivi budut u vidkritomu dostupi Vlasniki vebsajtu mayut mozhlivist zrobiti jogo nedostupnim dlya Wayback Machine za dopomogoyu robots txt Pravila robots txt zastosovuyutsya zadnim chislom yaksho vlasnik sajtu zablokuvav dlya internet arhivu dostup do nogo to vsi zaarhivovani ranishe storinki z cogo domenu takozh odrazu zh stayut nedostupnimi Krim togo pracivniki Internet Archive zayavili sho inodi vlasnik sajtu zv yazuyetsya z nami i prosit zupiniti skanuvannya ta arhivaciyu sajtu Mi vikonuyemo ci zapiti Krim togo na sajti napisano Internet Archive ne zacikavlenij u skanuvanni vebsajtu ta inshih internet dokumentiv abo nadanni dostupu do nih yaksho vlasniki ne hochut shob voni buli v zibranni Oklendska arhivna politika Politika vinyatku zadnim chislom Wayback Machine chastkovo gruntuyetsya na rekomendaciyah z upravlinnya zapitami na viluchennya i zberezhennya arhivnoyi cilisnosti angl Recommendations for Managing Removal Requests and Preserving Archival Integrity opublikovanih v Universiteti Kaliforniyi Berkli u 2002 roci yaki dayut vlasnikovi sajtu pravo zablokuvati dostup do arhivu sajtu Wayback dotrimuyetsya ciyeyi politiki shob za mozhlivosti uniknuti dorogih sudovih rozglyadiv Politika vinyatku zadnim chislom Wayback pochala poslablyuvatisya 2017 roku koli vin perestav zvazhati na fajli robots txt na amerikanskih uryadovih i vijskovih vebsajtah yak dlya yih skanuvannya tak i pokazu vidskanovanih vebstorinok Stanom na kviten 2017 Wayback ignoruye robots txt v shirshih mezhah ne tilki dlya uryadovih sajtiv SShA VikoristannyaVid 2001 roku koli Wayback Machine stala dostupnoyu gromadskosti naukovci vivchali yak sposobi yakimi vona zberigaye i zbiraye dani tak i sami storinki sho vzhe mistyatsya v yiyi arhivi Stanom na 2013 rik naukovci napisali blizko 350 statej pro Wayback Machine zdebilshogo v galuzyah informacijnih tehnologij bibliotekoznavstva ta suspilnih nauk Predstavniki suspilnih nauk skoristalisya Wayback Machine shob proanalizuvati yak rozvitok vebsajtiv pochinayuchi z seredini 1990 h rokiv i doteper vplinuv na tempi zrostannya kompanij Koli Wayback Machine arhivuye storinku vona zazvichaj vmishuye bilshist giperposilan zberigayuchi ci posilannya aktivnimi koli voni zaprosto mogli buti porusheni nestabilnistyu Internetu Indijski vcheni vivchali zdatnist Wayback Machine zberigati giperposilannya v naukovih onlajn publikaciyah i viznachili sho vona zberigaye trohi bilsh yak polovinu z nih Zhurnalisti vikoristovuyut Wayback Machine shob pereglyadati mertvi sajti zastarili novini i zmini v zmisti sajtu Jogo zmist vikoristovuyut shob prityagati politikiv do vidpovidalnosti j vikrivati brehnyu v zobrazhenni podij na poli boyu 2014 roku zaarhivovana z socialnoyi merezhi storinka Igorya Girkina zasvidchila yak vin hvalitsya sho jogo bijci zbili nibito ukrayinskij vijskovij litak Koli zh stalo vidomo sho naspravdi ce civilnij litak Malajzijskih avialinij Girkin vidaliv post i zvinuvativ ukrayinskih vijskovih u znishenni litaka Marsh za nauku v berezni 2017 roku rozpochavsya z obgovorennya na Reddit yake pokazalo sho htos vidvidav Archive org i viyaviv sho z sajtu Bilogo domu vilucheno vsi posilannya na zminu klimatu U vidpovid odin z koristuvachiv napisav Maye buti hoda naukovciv na Vashington Krim togo sajt aktivno vikoristovuyetsya dlya verifikaciyi zabezpechuyuchi redaktoram Vikipediyi dostup do posilan i mozhlivist stvoryuvati kontent Obmezhennya Popri svoyi mozhlivosti Wayback Machine takozh maye deyaki obmezhennya U 2014 roci zatrimka mizh skanuvannyam vmistu sajtiv i chasom koli vin buv dostupnim na Wayback Machine stanovila shist misyaciv Stanom na listopad 2018 roku chas zatrimki stanoviv vid 3 do 10 godin Wayback Machine ne ye istorichnim Google koristuvachi sami mayut znati URL adresi vebsajtiv yaki voni hochut pereglyanuti Isnuye funkciya Site Search poshuk sajtu yaka dozvolyaye koristuvacham znajti sajt na osnovi sliv sho opisuyut sajt a ne sliv znajdenih na samih vebstorinkah Wayback Machine ne mistit usih storinok koli nebud stvorenih cherez obmezhennya svogo Wayback Machine ne mozhe povnistyu arhivuvati vebstorinki yaki mistyat interaktivni funkciyi yak ot Flesh platformi i formi napisani na JavaScript bo ci funkciyi vimagayut vzayemodiyi z host sajtom Vebkrauleru skladno vidskanuvati vse sho zakodovano ne v HTML abo odnomu z jogo variantiv sho chasto prizvodit do zlamanih giperposilan ta vidsutnih zobrazhen Cherez ce vebkrauler ne arhivuye storinok sirit yaki ne mistyat posilan na inshi storinki Krauler Wayback Machine mozhe vidskanuvati lishe napered viznachenu kilkist giperposilan zgidno z napered zadanim obmezhennyam glibini tomu vin ne mozhe zaarhivuvati vsi giperposilannya na kozhnij storinci Deyaki vlasniki pomishayut na svij sajt fajl robots txt yakij ne dozvolyaye Wayback Machine znahoditi ta arhivuvati yih Krim togo vlasniki vebsajtiv takozh mozhut bezposeredno zv yazatisya z Internet arhivom i prositi shob yih storinki bulo vilucheno z arhivu Yak yuridichni dokazi Civilne sudochinstvo Netbula LLC proti Chordiant Software Inc U spravi 2009 roku Netbula LLC proti Chordiant Software Inc vidpovidach Chordiant podav klopotannya shob Netbula na svoyemu sajti vimknula fajl robots txt yakij zmushuvav Wayback Machine zadnim chislom zakrivati dostup do poperednih versij storinok zaarhivovanih z sajtu Netbula yaki na dumku Chordiant mogli b svidchiti na korist zahistu Netbula zaperechila proti cogo klopotannya na tij pidstavi sho vidpovidach zvertavsya z prohannyam zminiti sajt Netbula a jomu slid bulo bezposeredno zrobiti zapit do Internet arhivu za dostupom do zaarhivovanih storinok Prote spivrobitnik Internet Archive podav zayavu pid prisyagoyu v yakij pidtrimav diyu Chordiant zayavivshi sho vin ne mozhe vidati vebstorinki za dopomogoyu inshih zasobiv bez znachnogo navantazhennya vitrat i pereboyiv u jogo roboti Suddya Govard Llojd u Pivnichnomu okruzi Kaliforniyi viddili San Hose vidhiliv zaperechennya Netbula i nakazav jomu timchasovo vimknuti blokuvannya robots txt dlya togo shob Chordiant otrimav arhivni storinki Telewizja Polska U zhovtni 2004 roku u spravi Telewizja Polska USA Inc proti Echostar Satellite No 02 C 3293 65 Fed R Evid Serv 673 N D Ill October 15 2004 pozivach mabut vpershe v istoriyi namagavsya vikoristati Wayback Machine yak dzherelo dopustimih dokaziv Kompaniya Telewizja Polska ye provajderom TVP Polonia i en yaka upravlyaye Dish Network Do pochatku sudovogo rozglyadu EchoStar vkazala sho maye namir zaproponuvati znimki Wayback Machine yak dokaz minulogo zmistu sajtu Telewizja Polska Kompaniya Telewizja Polska podala en shob zavaditi vikoristannyu znimkiv na tij pidstavi sho nibito ce chutki i neperevirene dzherelo ale suddya Arlander vidhiliv tverdzhennya Telewizja Polska sho nibito ce chutki j vidmoviv u klopotanni pro nerozgoloshennya shodo viluchennya dokaziv z procesu Patentne pravo Za umovi vikonannya deyakih dodatkovih vimog napriklad nadannya avtoritetnoyi zayavi arhivista en i en prijmayut vid Internet arhivu vidmitki chasu yak dokaz togo koli cya vebstorinka bula dostupna gromadskosti Ci dani vikoristovuyutsya dlya viznachennya chi vebstorinku mozhna vvazhati prior art napriklad pid chas rozglyadu zayavki na patent Cenzura ta inshi zagroziStanom na gruden 2016 roku Archive org en Elison Makrina direktorka Library Freedom Project zaznachaye sho hocha bibliotekari gliboko cinuyut nedotorkanist privatnogo zhittya mi takozh rishuche vistupayemo proti cenzuri Vidomi okremi vipadki koli sajt zakriv onlajn dostup do materialiv cherez yaki vipadkovi lyudi opinilis u nebezpeci Sered inshih zagroz stihijni liha znishennya distancijne abo fizichne manipulyaciya vmistom arhivu div takozh hakerska ataka rezervne kopiyuvannya problematichne avtorske pravo i sposterezhennya za koristuvachami sajtu Kevin Voen pidozryuye sho v dovgostrokovij perspektivi bagatoh pokolin majzhe nichogo ne zalishitsya takogo shob cim mozhna bulo praktichno skoristatis ale yaksho zberezhetsya nastupnist nashoyi tehnologichnoyi civilizaciyi to znachnu chastinu golih danih mozhna bude znajti j dosliditi Vlasniki Internet arhivu zayavlyayut sho vin pobudovanij z rozrahunkom na trivalu perspektivu Vtim avtori statti u zhurnali The Atlantic opisuyut jogo robotu yak nesamovite namagannya vihopiti dani persh nizh voni zniknut ne mayuchi dlya cogo yakoyis bilsh mensh nadijnoyi trivaloyi infrastrukturi Div takozhKolektivna pam yat en Glibinna merezha en Library Genesis en Vebarhivuvannya WebCite Archive isPrimitki WHOIS Arhiv originalu za 14 travnya 2020 Procitovano 13 bereznya 2016 WHOIS Arhiv originalu za 12 travnya 2020 Procitovano 13 bereznya 2016 alexa com Arhiv originalu za 23 bereznya 2019 Procitovano 4 lyutogo 2019 Notess Greg R March April 2002 The Wayback Machine The Web s Archive Online 26 59 61 cherez EBSCOhost The Wayback Machine Frequently Asked Questions originalu za 18 veresnya 2018 procitovano 18 veresnya 2018 20 000 Hard Drives on a Mission Internet Archive Blogs blog archive org angl originalu za 20 zhovtnya 2018 Procitovano 15 zhovtnya 2018 Green Heather 28 lyutogo 2002 BusinessWeek Arhiv originalu za 20 grudnya 2011 Tong Judy 8 veresnya 2002 Responsible Party Brewster Kahle A Library Of the Web On the Web New York Times originalu za 20 lyutogo 2011 Procitovano 15 serpnya 2011 Internet Archive Wayback Machine archive org angl originalu za 3 sichnya 2014 Procitovano 15 zhovtnya 2018 Cook John 1 listopada 2001 Web site takes you way back in Internet history Seattle Post Intelligencer originalu za 12 serpnya 2014 Procitovano 15 serpnya 2011 Wayback Goes Way Back on Web Wired 28 zhovtnya 2001 originalu za 16 zhovtnya 2017 Procitovano 16 zhovtnya 2017 Arora Sanjay K Li Yin Youtie Jan Shapira Philip 5 travnya 2015 Using the wayback machine to mine websites in the social sciences A methodological resource Journal of the Association for Information Science and Technology angl 67 8 1904 1915 doi 10 1002 asi 23503 ISSN 2330 1635 Kalev Leetaru 28 sichnya 2016 The Internet Archive Turns 20 A Behind the Scenes Look at Archiving the Web Forbes originalu za 16 zhovtnya 2017 Procitovano 16 zhovtnya 2017 Kahle Brewster Archiving the Internet Scientific American March 1997 Issue originalu za 3 kvitnya 2012 Procitovano 19 serpnya 2011 Jeff Kaplan 27 zhovtnya 2014 Archive It Crawling the Web Together Internet Archive Blogs originalu za 12 zhovtnya 2017 Procitovano 16 zhovtnya 2017 Worldwide Web Crawls Internet Archive originalu za 19 zhovtnya 2017 Procitovano 16 zhovtnya 2017 Wide Crawl Number 13 Internet Archive originalu za 19 zhovtnya 2017 Procitovano 16 zhovtnya 2017 Internet Archive Petabox archive org angl Procitovano 25 zhovtnya 2018 Kanellos Michael 29 lipnya 2005 CNET News com Arhiv originalu za 3 kvitnya 2007 Procitovano 29 lipnya 2007 Internet Archive and Sun Microsystems Create Living History of the Internet Sun Microsystems 25 bereznya 2009 originalu za 26 bereznya 2009 Procitovano 27 bereznya 2009 Mearian Lucas 19 bereznya 2009 Computerworld com Arhiv originalu za 23 bereznya 2009 Procitovano 22 bereznya 2009 Updated Wayback Machine in Beta Testing Archive org originalu za 23 serpnya 2011 Procitovano 19 serpnya 2011 Beta Wayback Machine in forum Archive org originalu za 17 kvitnya 2014 Procitovano 16 kvitnya 2014 Internet Archive Forums 6th pair of racks go into service over 2PB of data space used archive org angl originalu za 24 zhovtnya 2016 Procitovano 25 zhovtnya 2018 Wayback Machine Now with 240 000 000 000 URLs Internet Archive Blogs Blog archive org 9 sichnya 2013 originalu za 14 kvitnya 2014 Procitovano 16 kvitnya 2014 Rossi Alexis 25 zhovtnya 2013 Fixing Broken Links on the Internet archive org San Francisco CA US Collections Team the Internet Archive originalu za 7 listopada 2014 Procitovano 25 bereznya 2015 We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine This service allows anyone wikipedia editors scholars legal professionals students or home cooks like me to create a stable URL to cite share or bookmark any information they want to still have access to in the future The VirusTotal Team 25 bereznya 2015 207 241 226 190 IP address information virustotal com Dublin 2 Ireland VirusTotal originalu za 14 lipnya 2014 Procitovano 25 bereznya 2015 2015 03 25 Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset 2 62 2015 03 25 16 14 12 complete URL redacted Renegotiating TLS pdf 1 62 2015 03 25 04 46 34 complete URL redacted CBLightSetup exe Advisory provided by Google 25 bereznya 2015 Safe Browsing Diagnostic page for archive org google com safebrowsing Mountain View CA US Google originalu za 6 kvitnya 2015 Procitovano 25 bereznya 2015 2015 03 25 Part of this site was listed for suspicious activity 138 time s over the past 90 days What happened when Google visited this site Of the 42410 pages we tested on the site over the past 90 days 450 page s resulted in malicious software being downloaded and installed without user consent The last time Google visited this site was on 2015 03 25 and the last time suspicious content was found on this site was on 2015 03 25 Malicious software includes 169 trojan s 126 virus 43 backdoor s Internet Archive Frequently Asked Questions originalu za 21 zhovtnya 2009 Procitovano 17 sichnya 2015 18 grudnya 2014 Arhiv originalu za 18 grudnya 2014 Procitovano 13 grudnya 2018 Can the manipulation of big data change the way the world thinks The National originalu za 12 sichnya 2017 Procitovano 14 travnya 2017 Crockett Zachary 28 veresnya 2018 Inside Wayback Machine the internet s time capsule The Hustle amer originalu za 2 zhovtnya 2018 Procitovano 26 zhovtnya 2018 Heffernan Virginia 18 veresnya 2018 Things Break and Decay on the Internet That s a Good Thing WIRED angl originalu za 25 veresnya 2018 Procitovano 26 zhovtnya 2018 adafruit Arhiv originalu za 2 grudnya 2020 Procitovano 2 grudnya 2020 Alexa Internet Arhiv originalu za 28 zhovtnya 2013 Procitovano 29 zhovtnya 2013 Alexa Internet Arhiv originalu za 9 kvitnya 2015 Procitovano 9 kvitnya 2015 web archive org 23 bereznya 2019 Arhiv originalu za 23 bereznya 2019 Procitovano 5 kvitnya 2019 michelle 9 travnya 2014 Wayback Machine Hits 400 000 000 000 Internet Archive originalu za 26 serpnya 2014 Procitovano 25 bereznya 2015 Internet Archive Arhiv originalu za 13 lyutogo 2015 Procitovano 25 bereznya 2015 Some sites are not available because of Robots txt or other exclusions 15 kvitnya 2011 u Wayback Machine How can I remove my site s pages from the Wayback Machine 17 kvitnya 2014 u Wayback Machine Cox Joseph 22 travnya 2018 The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers Arhiv originalu za 23 travnya 2018 Procitovano 23 travnya 2018 Recommendations for Managing Removal Requests And Preserving Archival Integrity University of California 14 grudnya 2002 originalu za 18 veresnya 2017 Procitovano 14 veresnya 2017 Retroactive robots txt removal of past crawls AKA Oakland Archive Policy Internet Archive 7 lipnya 2014 originalu za 10 zhovtnya 2017 Procitovano 14 veresnya 2017 Mark Graham 17 kvitnya 2017 Robots txt meant for search engines don t work well for web archives Internet Archive Blogs originalu za 17 kvitnya 2017 Procitovano 16 kvitnya 2017 Archivierung des Internets Internet Archive ignoriert kunftig robots txt nim heise online originalu za 27 kvitnya 2017 Procitovano 14 travnya 2017 Suchmaschinen Internet Archive will kunftig Robots txt Eintrage ignorieren Golem de nim originalu za 19 chervnya 2017 Procitovano 14 travnya 2017 Internet Archive will ignore robots txt files to keep historical record accurate Digital Trends 24 kvitnya 2017 originalu za 16 travnya 2017 Procitovano 14 travnya 2017 Sampath Kumar B T Prithviraj K R 21 zhovtnya 2014 Bringing life to dead Role of Wayback Machine in retrieving vanished URLs Journal of Information Science angl 41 1 71 81 doi 10 1177 0165551514552752 ISSN 0165 5515 Wayback Machine Won t Censor Archive for Taste Director Says After Olympics Article Scrubbed originalu za 6 sichnya 2017 Procitovano 14 travnya 2017 What the Web Said Yesterday The New Yorker originalu za 25 sichnya 2015 Procitovano 14 travnya 2017 The March for Science began with this person s throwaway line on Reddit Washington Post originalu za 23 kvitnya 2017 Procitovano 23 kvitnya 2017 Are scientists going to march on Washington The Washington Post originalu za 31 sichnya 2017 Procitovano 31 sichnya 2017 Foley Katherine Ellen The global March for Science started with a single Reddit thread Quartz originalu za 24 kvitnya 2017 Procitovano 23 kvitnya 2017 http blog archive org 2018 10 01 more than 9 million broken links on wikipedia are now rescued Internet Archive 2 kvitnya 2014 Arhiv originalu za 2 kvitnya 2014 Procitovano 23 listopada 2018 Internet Archive Frequently Asked Questions archive org angl Procitovano 23 listopada 2018 Bates Mary Ellen 2002 The Wayback Machine Online 26 80 cherez EBSCOhost Internet Archive Frequently Asked Questions archive org angl originalu za 20 kvitnya 2013 Procitovano 18 zhovtnya 2018 Lloyd Howard October 2009 PDF Arhiv originalu PDF za 8 serpnya 2019 Procitovano 15 zhovtnya 2009 Cortes Antonio October 2009 Arhiv originalu za zhovten 27 2010 Procitovano 15 zhovtnya 2009 Gelman Lauren 17 listopada 2004 Internet Archive s Web Page Snapshots Held Admissible as Evidence Packets 2 3 originalu za 30 kvitnya 2011 Procitovano 4 sichnya 2007 Howell Beryl A February 2006 PDF Journal of Internet Law 3 9 Arhiv originalu PDF za 5 lipnya 2010 Procitovano 6 serpnya 2008 Wynn W Coggins Fall 2002 Prior Art in the Field of Business Method Patents When is an Electronic Document a Printed Publication for Prior Art Purposes USPTO originalu za 21 veresnya 2012 Conger Kate Backing up the history of the internet in Canada to save it from Trump TechCrunch originalu za 27 grudnya 2016 Procitovano 14 travnya 2017 Where to find what s disappeared online and a whole lot more the Internet Archive Public Radio International originalu za 28 bereznya 2017 Procitovano 14 travnya 2017 Help Us Keep the Archive Free Accessible and Reader Private Internet Archive Blogs originalu za 21 travnya 2017 Procitovano 14 travnya 2017 Internet Archive Proposed Changes To DMCA Would Make Us Censor The Web Consumerist 7 chervnya 2016 originalu za 11 listopada 2016 Procitovano 14 travnya 2017 Herb Ulrich Die Trump Angst grassiert nim heise online originalu za 7 grudnya 2016 Procitovano 14 travnya 2017 LaFrance Adrienne The Internet s Dark Ages The Atlantic originalu za 7 travnya 2017 Procitovano 14 travnya 2017 The Entire Internet Will Be Archived In Canada to Protect It From Trump en us Motherboard originalu za 16 travnya 2017 Procitovano 14 travnya 2017 LaFrance Adrienne The Human Fear of Total Knowledge The Atlantic originalu za 2 grudnya 2016 Procitovano 14 travnya 2017 PosilannyaOficijnij sajt Terms of use privacy and copyright policy archive org 31 grudnya 2014 com angl nim isp fr ital Arhiv originalu za 15 bereznya 2020 Procitovano 20 kvitnya 2019 Internet history is fragile This archive is making sure it doesn t disappear 8 kvitnya 2021 u Wayback Machine Dzerkala Official mirror of the Wayback Machine Arhiv originalu za 28 listopada 2012 Procitovano 20 kvitnya 2019 Utiliti sourceforge net Arhiv originalu za 16 veresnya 2011 Procitovano 20 kvitnya 2019 za IIPC github com Arhiv originalu za 3 travnya 2021 Procitovano 20 kvitnya 2019 angl pol Arhiv originalu za 21 bereznya 2018 Procitovano 20 kvitnya 2019