Настя и сборник весёлых историй
Поисковые системы Интернета имеют в основном, на обход текста на веб-страницах, но Google глубоко разбирается в том, как анализировать и организовывать структурированные данные, заявил в пятницу сотрудник компании.
«В Интернете много структурированных данных, и мы не делая хорошую работу по представлению его нашим пользователям », - сказал Алон Халеви во время беседы на конференции в Нью-Бланде в Нью-Йорке в Массачусетском технологическом институте,
Халеви частично ссылался на так называемые источники« глубокой паутины », например, базы данных, которые расположены за веб-сайтами, управляемыми формами, такими как Cars.com или Realtor.com. В течение некоторого времени Google отправляет запросы в различные формы, извлекает результирующие веб-страницы и включает их в свой индекс поиска, если информация выглядит полезной.
[Читать дальше: Лучшие телевизионные потоковые службы]Но компания также хочет проанализировать данные, найденные в структурированных таблицах на многих веб-сайтах, сказал Халеви, предлагая в качестве примера таблицу на веб-странице, в которой перечислены президенты США.
И есть множество этих таблиц - индекс Google появился 14 миллиард из них, согласно Халеви. Он «очень быстро осознал, что более 98 процентов из них не так уж и интересны», но даже после значительной фильтрации осталось около 154 миллионов таблиц, которые нужно индексировать, сказал он.
Одна из главных целей Google - предоставить результаты, которые организуют «аспекты» «поискового запроса, особенно исследовательского, такого как« путешествия во Вьетнаме », в отличие от запроса определенного факта, такого как« население Вьетнама », сказал Халеви. Например, первый запрос привел бы информацию о визовых требованиях, погодных и туристических пакетах.
Идея имеет отголоски поисковой службы, предлагаемой Kosmix, но Google хочет пойти дальше, по словам Халеви. «Kosmix предоставит вам« аспект », но он привязан к источнику информации», - сказал он.
Поиск «путешествия по Вьетнаму» в Kosmix дает организованный набор результатов, включая отзывы ресторанов из New York Times, изображения с Yahoo и Flickr, информацию о покупках от Shopping.com и общие результаты в Интернете от Google.
«В нашем случае все аспекты могут быть просто результатами веб-поиска, но мы бы организовали их по-другому», сказал Халеви.
Пресс-центр нацеливает небольшие газеты, стремящиеся к работе в Интернете
Пресс-центр Media, поставщик технологий и услуг для цифрового издательства, предлагает размещение издательских услуг, направленных на издатели небольших изданий.
Google приветствует ослабленный в Интернете закон об авторском праве в Интернете
Немецкий Бундестаг принял спорный, но ослабленный, онлайн-законопроект об авторском праве, который дает издателям исключительное право на создание коммерческое использование своих публикаций в Интернете.
Личные данные Microsoft Personal Data Dashboard позволяют вам решать, как Microsoft использует ваши данные
Личные данные Microsoft Personal Data позволяют отказаться от рекламы и решить, как вы хотите, чтобы Microsoft использовала ваши данные.