Android

Исследователь Google нацеливает структурированные данные в Интернете

Настя и сборник весёлых историй

Настя и сборник весёлых историй
Anonim

Поисковые системы Интернета имеют в основном, на обход текста на веб-страницах, но Google глубоко разбирается в том, как анализировать и организовывать структурированные данные, заявил в пятницу сотрудник компании.

«В Интернете много структурированных данных, и мы не делая хорошую работу по представлению его нашим пользователям », - сказал Алон Халеви во время беседы на конференции в Нью-Бланде в Нью-Йорке в Массачусетском технологическом институте,

Халеви частично ссылался на так называемые источники« глубокой паутины », например, базы данных, которые расположены за веб-сайтами, управляемыми формами, такими как Cars.com или Realtor.com. В течение некоторого времени Google отправляет запросы в различные формы, извлекает результирующие веб-страницы и включает их в свой индекс поиска, если информация выглядит полезной.

[Читать дальше: Лучшие телевизионные потоковые службы]

Но компания также хочет проанализировать данные, найденные в структурированных таблицах на многих веб-сайтах, сказал Халеви, предлагая в качестве примера таблицу на веб-странице, в которой перечислены президенты США.

И есть множество этих таблиц - индекс Google появился 14 миллиард из них, согласно Халеви. Он «очень быстро осознал, что более 98 процентов из них не так уж и интересны», но даже после значительной фильтрации осталось около 154 миллионов таблиц, которые нужно индексировать, сказал он.

Одна из главных целей Google - предоставить результаты, которые организуют «аспекты» «поискового запроса, особенно исследовательского, такого как« путешествия во Вьетнаме », в отличие от запроса определенного факта, такого как« население Вьетнама », сказал Халеви. Например, первый запрос привел бы информацию о визовых требованиях, погодных и туристических пакетах.

Идея имеет отголоски поисковой службы, предлагаемой Kosmix, но Google хочет пойти дальше, по словам Халеви. «Kosmix предоставит вам« аспект », но он привязан к источнику информации», - сказал он.

Поиск «путешествия по Вьетнаму» в Kosmix дает организованный набор результатов, включая отзывы ресторанов из New York Times, изображения с Yahoo и Flickr, информацию о покупках от Shopping.com и общие результаты в Интернете от Google.

«В нашем случае все аспекты могут быть просто результатами веб-поиска, но мы бы организовали их по-другому», сказал Халеви.