Один из самых посещаемых сайтов в Интернете, энциклопедия на основе Википедии, которую может редактировать каждый, не показывает никакой рекламы своим читателям. Это принцип. С самого начала его основатели полагали, что реклама будет означать возможный конфликт интересов. Вместо этого Wikimedia Foundation живет постами. Одним из основных участников является Google, который выделил 3 миллиона долларов на управление организацией. В общей сложности Google потратил более семи с половиной миллионов долларов на деятельность Википедии за последнее десятилетие. Часть вклада направлена непосредственно на долгосрочный проект Wikimedia Foundation, остальная часть — на нормальную работу. Фонд управляет активами в размере 145 миллионов долларов, а годовой бюджет — 104 миллионов долларов. Самая большая статья расходов — заработная плата и гранты, предоставляемые организацией. Взносы доноров на сегодняшний день являются крупнейшим источником дохода (более 95%) каждый год.

Google использует Wikimedia в качестве базы знаний. Напомним, что в 2008 году Google попыталась запустить собственный конкурс Wikipedia. Ее звали Knol, и она обещала достоверную информацию, написанную экспертами и мирянами со всего мира. Однако проект не был принят и через четыре года Google сократил его без компенсации. В этом случае мотивация Google не обязательно самоотверженна.

гугл

Google использует контент Википедии во многих своих продуктах. Особенно в поисках, где информация из Википедии часто появляется не только среди первых «органических результатов поиска», но и в ответ на вопрос в форме окна с краткой информацией. Википедия также является частым источником информации для быстрых ответов Google Now на фактические вопросы. Именно эти удивительно точные ответы дают помощнику Google конкурентное преимущество. Конечно, вырезки и ответы помощника показывают не только информацию из Википедии, но и из других источников. Однако из-за неопределенности в отношении будущих поправок к закону об авторском праве, Google может не иметь возможности просматривать некоторые страницы, не заплатив за них. Это не относится к Википедии, которая публикует контент под лицензией Creative Commons. Для поисковой системы существование Википедии очень выгодно. А поскольку Google является наиболее широко используемой поисковой системой практически во всех странах мира (кроме Китая, где он запрещен, и в России, где местный Яндекс опережает его на несколько процентов), для поисковой системы важно, чтобы Википедия хорошо работала во всем мире.

Читайте также:  YouTube разрабатывает конкурента TikTok под названием Shorts

Википедия является крупнейшим источником знаний в мире, как по объему, так и по широте тем. Однако это относится главным образом к английской Википедии, которая содержит более пяти миллионов статей, в результате более 875 миллионов изменений. В дополнение к написанной на английском языке Википедии активно ведется работа над немецким, французским, испанским, русским и японским языками, которые имеют не менее 10 000 активных редакторов. Тем не менее, ряд «меньшей Википедии», языковой вариант менее широко используемого языка, сталкивается с нехваткой авторов, редакторов и, следовательно, контента. Google хочет помочь Википедии в этом отношении, предлагая участникам возможность использовать встроенный машинный перевод с Google Translate. Сейчас он использует глубокое машинное обучение для лучшего перевода в контексте предложения.

google-translate

Таким образом, эти автоматизированные инструменты должны помочь расширить ресурс на языках, которые относительно распространены с точки зрения количества активных пользователей, но их присутствие в Википедии невелико. Например, более 10 миллионов человек могут общаться с языком зулу в качестве родного языка (и еще 16 миллионов используют его в качестве второго языка), но версия Wikipedia пока содержит только тысячу статей. Это может помочь изменить машинный перевод. Конечно, у компьютерного перевода также есть недостатки, особенно преувеличенный акцент на контексте иностранного языка за счет местных проблем. В прошлом Google поддерживал проект по созданию статей в Википедии на 23 индийских языках (Project Tiger).

Википедия давно служит не только пользователям. Разработчики, которые экспериментируют с различными формами «искусственного интеллекта» или, точнее, нейронных сетей, черпают из него данные. Поскольку данные Википедии предоставляются по лицензии Creative Commons, которая (в некоторых версиях) позволяет использовать данные бесплатно для других целей, они стали желанным ресурсом для обучения или работы с нейронной сетью. Этому способствует относительно надежная структура категорий, ярлыков и таблиц, что делает продукт привлекательной коллекцией машиночитаемых, созданных человеком данных обо всем — от глав государств до списка массовых убийств в США.

Читайте также:  Sony представила логотип PlayStation 5

гугл пожертвовал википедии

Разговорные роботы, такие как Siri и Alexa, используют эти знания, и гиганты Apple и Amazon также являются сторонниками Wikimedia Foundation. По мере того как эти помощники приобретают все большее значение по мере роста числа людей из развивающихся стран, википедия будет развиваться на менее широко распространенных языках. Google знает, что для того, чтобы преуспеть в этих пока еще небольших (но, возможно, десятилетних крупных местных рынках), новым пользователям необходимо найти в Интернете страницы на своем языке. Поэтому инвестиции в такой ресурс как Википедия — это инвестиции для Google в собственное будущее.

Оставить комментарий

avatar
  Подписаться  
Уведомление о