Car-tech

Google: опубликовано 129 миллионов разных книг

Мультики про машинки новые серии 2017 - Кто сильнее! Лучшие мультфильмы для детей /#мультик игра

Мультики про машинки новые серии 2017 - Кто сильнее! Лучшие мультфильмы для детей /#мультик игра
Anonim

Для тех, кто когда-либо задумывался о том, сколько разных книг доступно в мире, у Google есть ответ для вас: 129 864 880, по словам Леонида Тайчера, инженера по программному обеспечению Google, который работает над проектом Google Books.

Оценка количества книг в мире - это больше, чем любопытство для поискового гиганта: он также дает дорожную карту того, что еще предстоит сделать, чтобы выполнить амбициозную задачу компании по организации всей мировой информации.

«Когда вы являетесь частью компании, которая пытается оцифровать все книги в мире, первый вопрос, который вы часто получаете, - это: «Сколько там книг?», - объяснил Тайкер в сообщении в блоге, объявив об оценке.

[Читать дальше: Лучшие телевизионные потоковые сервисы]

Чтобы придумать разумное приближение, компания начала с того, что глотала информацию о книгах из множества систем каталогизации, таких как Международные стандартные номера книг (ISBN).

Такие каталоги, хотя и полезны, не дают окончательного подсчета, Однако. Например, ISBN были отнесены только к книгам с 1960-х годов и, как правило, используются только в западных странах.

Кроме того, для отдельных номеров ISBN были присвоены несколько книг, а издатель назначил ISBN для предметов, отличных от книг, таких как футболки и DVD.

Таким образом, инженеры Google написали программы, чтобы расчесывать около 150 таких каталогов и каталогов, и устранить столько дубликатов записей, сколько можно было бы найти.

Компании также пришлось сделать несколько жесткие решения о том, что есть и не является книгой, объяснил Тейхер.

Например, мягкие обложки и твердые обложки текста считаются двумя книгами, равно как и различные версии популярного текста, такие как Шекспир «Гамлет», из-за предисловий и комментариев, которые они могут содержать. Согласно 9 июня, компания провела проверку 12 миллионов книг в соответствии с презентацией инженера-разработчика Google Books Джона Орванта на ежегодной технической конференции USENIX в Бостоне. Эти книги были написаны примерно на 480 языках (в том числе 3 книги на языке Клингонов, инициированных Star Trek).

Компания планирует завершить сканирование существующих книг в течение десятилетия. В результате виртуальная коллекция будет состоять из четырех миллиардов страниц и двух триллионов слов, сказал Орвант.

Около 20 процентов книг в мире находятся в общественном достоянии, пояснил Орвант. Отпечатано от 10 до 15 процентов этих книг. Остальные книги - подавляющее большинство всех названий - все еще находятся под защитой авторского права, но без печати. Google в процессе заимствования копий этих книг, чтобы оцифровать их, из примерно 40 крупных библиотек по всему миру.

Это этот акт сканирования в книгах, которые не печатаются, но по-прежнему охватываются авторским правом, которое было выполнено с некоторым сопротивлением издательской индустрии.

В настоящее время компания ждет решения от Окружного суда США по Южному округу Нью-Йорка о том, может ли он сканировать эти книги.

В 2005 году Гильдия авторов и Ассоциация американских издателей отдельно подала иск против поискового гиганта, заявив, что компания нарушает авторские права путем сканирования в книгах.

Google заявила, что хочет продавать цифровые копии этих, печатать книги и откладывать роялти, на которые претендуют авторы. Компания также надеется раскрыть фрагменты этих книг в поисках в Интернете и утверждает, что это использование подпадает под доктрину США.

Сканирование во всех книгах мира приведет к другим преимуществам в дополнение к улучшению поисков, пояснил Орвант. После того, как все эти тома будут оцифрованы, их содержимое может быть подвергнуто анализу, что может привести к новым представлениям. Лингвисты могут обнаружить, когда некоторые слова стали широко использоваться или кто первым начал использовать эти слова.

Поиск книг Google также может помочь ответить на некоторые выдающиеся исторические вопросы: например, он может сообщить о том, что Исаак Ньютон и Готфрид Лейбниц - или кто-то другой - изобрели исчисление.

«Мы можем искать не только для но для концепции », объяснил Орвант. «Мы можем принять все разные способы [что идея] бесконечности может быть изменена, перевести ее на разные языки и выполнить поиск параллельно».

«Я надеюсь, что, когда мы начнем раскрывать гораздо больше эта коллекция позволит людям задавать такие вопросы, о которых они раньше не могли спросить », - сказал он.

Редактор службы новостей IDG Хуан Карлос Перес внесла свой вклад в этот отчет.

Joab Jackson охватывает корпоративное программное обеспечение и общие новости о технологиях для

Служба новостей IDG. Следуйте за Joab в Twitter на @Joab_Jackson. Адрес электронной почты Joab - [email protected]