Freebase — велика колаборативна база знань, що містить метадані, складені в основному спільнотою. Це онлайн-колекція структурованих даних, зібраних з багатьох джерел, наприклад окремих Вікі. Freebase має на меті створити глобальний ресурс, що дозволить людям та машинам отримувати доступ до загальновідомої інформації набагато ефективніше. Розробляється американською софтверною компанією Metaweb і працює публічно з березня 2007. Metaweb була куплена Google (проанонсовано 16 липня 2010), і стала основою їх технології Knowledge Graph.
Тип | Онлайн-база даних |
---|---|
Розробник | Metaweb Technologies |
Доступні мови | Англійська мова |
Ліцензія | Creative Commons Attribution License |
Репозиторій | github.com/google/graphd |
Вебсайт | www.freebase.com |
Freebase у Вікісховищі |
Дані Freebase доступні free/libre для комерційного та некомерційного використання під ліцензією Creative Commons Attribution. Для програмістів надається API, RDF endpoint [ 5 червня 2012 у Wayback Machine.], та дампи [ 20 червня 2010 у Wayback Machine.]. Google включає медіаінформацію з Freebase.
Огляд Редагувати
3 березня 2007 Metaweb публічно анонсувало Freebase, описавши компанію як «відкрита поділена база всіх світових знань», та «масивна багатокористувацька база з даними, що взаємопосилаються». Загалом це велетенська модель «сутність - зв'язок», яка багато в чому базується на вікіпедійних даних. Freebase має інтерфейс, який дозволяє непрограмістам заповнювати її інформацією, та категоризувати і об'єднувати елементи даних у змістовний, тобто семантичний спосіб.
Описана Тімом О'Рейлі після запуску як «міст між баченням колективного інтелекту Веб 2.0 та більш структурованого світу семантичного вебу».
Freebase містить дані, що зібрані з таких джерел як Вікіпедія, ChefMoz, NNDB, та MusicBrainz, та дані, внесені користувачами. Всі дані поширюються під ліцензією Creative Commons Attribution, . Програмістам надається HTTP-API, яке дає доступ до даних у форматі JSON. Початковий код самого продукту Metaweb є власницьким.
Freebase працює на власній інфраструктурі Metaweb, яка реалізує представлення у вигляді графа. Це означає, що замість використання таблиць та ключів для опису структур даних Freebase використовує вузли на набір лінків, які встановлюють відношення між вузлами. Через те що дані не ієрархічні, Freebase може моделювати набагато складніші відношення між окремими елементами, ніж звичайні БД, та відкрита для додавання нових сутностей та зв'язків у граф.
Запити до бази здійснюються мовою «Metaweb Query Language» (MQL).
Розробка Редагувати
Денні Хілліс вперше описав ідею створення павутини знань, яку він назвав Аристотель, у своїй роботі 2000 року. Але він не пробував побудувати систему аж поки не найняв двох технічних експертів та співзасновників. Роберт Кук — спеціаліст із паралельних обчислень та дизайну БД, зараз є виконавчим віце-президентом Metaweb з розвитку продукту. John Giannandrea, колишній головний технолог у Tellme Networks та головний технолог групи розробки браузерів в Netscape/AOL, є технічним директором компанії.
Спочатку доступна тільки через запрошення, Freebase відкрилася для публічного анонімного доступу на альфа-стадії розробки, і тепер вимагає реєстрації тільки тих, хто вносять дані.
29 жовтня 2008, на конференції International Semantic Web Conference 2008, Freebase випустила свій RDF-сервіс для генерування RDF-представлень сутностей Freebase, дозволяючи використання Freebase як Linked Data.
Організація та політики Редагувати
Об'єкти, про які Freebase містить інформацію (і які часто мають відповідні статті Вікіпедії), називаються топіками англ. topics, і дані, що зберігаються про них, залежать від їхнього типу. Наприклад запис про губернатора Каліфорнії Арнольда Шварцнеггера, вводиться як топік, що включає набір типів, які описують його як актора, бодібілдера та політика. Freebase містить приблизно 11.5 мільйонів топіків на квітень 2010.
Онтології Freebase, відомі як «типи» — також доступні для редагування. Кожен тип має кілька предикатів, що називаються властивостями англ. properties.
на відміну від підходу до семантичної павутини W3C, яка починається з контрольованих онтологій, Metaweb прийняв підхід фолксономії, в якому люди можуть додавати нові категорії (майже як теги), в кашу припущень, що потенційно перекриваються.
Freebase має багато відмінностей від моделі вікі. Користувачі можуть створювати свої власні типи, але ці типи не приймаються в «суспільне надбання», поки їх не перевірить працівник Metaweb. Також користувачі не можуть модифікувати типи один одного. Причина того, що Freebase не дає можливості зміни схеми в тому, що певні зовнішні сервіси можуть залежати від неї, і зміна схеми, наприклад видалення властивості тягне за собою їхній збої в їх запитах для API, і навіть всередині Freebase (наприклад у збережених розрізах).
Metaweb надає деяким користувачам статус експерта [ 30 червня 2012 у Wayback Machine.], аналогічний статусу адміністраторів Вікіпедії.
Також підтримуються багатомовні дані, але в цей час основною мовою відображення даних для всіх користувачів є англійська.
Закриття Freebase Редагувати
16 листопада 2015 Google офіційно оголосив Knowledge Graph API [ 24 травня 2018 у Wayback Machine.], який має стати заміною Freebase API. Freebase.com офіційно був закритий 2 травня 2016.
Критика Редагувати
Застосування Редагувати
- Google Refine [1] [ 14 липня 2010 у Wayback Machine.] — інструмент для очищення та отримання даних
- Powerset[en] — семантичний пошуковий рушій, який здійснює пошук по Freebase відповідей на питання, задані природною мовою (куплений Microsoft та використовується в пошуковій системі Bing).
- — переглядач родоводів.
- — Freebase IMDB
- — клон Google sets, що використовує дані Freebase
- — альтернативний інтерфейс користувача
- — візуалізатор онтологій Freebase
- — візуальний інструмент, що базується на графах
Див. також Редагувати
Вікідані мають властивість P646:ідентифікатор Freebase (використання) |
- DBpedia
- Cyc
- True Knowledge[en]
- Семантична павутина
Примітки Редагувати
- http://www.freebase.com/m/021ympy
- Wang Z., Zhang J., Feng J. et al. Knowledge Graph and Text Jointly Embedding // Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP) — ACL, 2014.
- — Коледж Сіммонса, 2008. — 350 с.
- Markoff, John (9 березня 2007). . Нью-Йорк Таймс. Архів оригіналу за 17 квітня 2018. Процитовано 9 березня 2007.
- . Архів оригіналу за 18 липня 2010. Процитовано 27 березня 2011.
- . www.google.com. Архів оригіналу за 17 лютого 2011. Процитовано 30 червня 2009.
- ↑ . O'Reilly Radar. 8 березня 2007. Архів оригіналу за 14 жовтня 2008. Процитовано 9 березня 2007.
- Markoff, John (9 березня 2007). . nytimes. Архів оригіналу за 24 травня 2015. Процитовано 7 лютого 2009.
- Introducing the Freebase RDF service. оригіналу за 16 травня 2012. Процитовано 19 лютого 2009.
- . Архів оригіналу за 14 червня 2010. Процитовано 27 березня 2011.
- new-experts-programme. оригіналу за 3 квітня 2009. Процитовано 7 лютого 2009.
- So long and thanks for all the data!. 2 травня 2016. Архів оригіналу за 8 липня 2012. Процитовано 5 травня 2016.
- Freebase Contribution Guidelines. Архів оригіналу за 16 липня 2013. Процитовано 27 лютого 2009.
Посилання Редагувати
- Офіційний сайт
- Freebase Blog [ 11 квітня 2012 у Wayback Machine.]
- Freebase Wiki