Золотой век

Сегодня мы стоим на пороге создания искусственного интеллекта, построенного по кальке мышления миллиардов людей, каждый из которых обладает в интернете свободой выбора одного из 10 результатов поисковой выдачи Google.

Выдача строится на основе глубочайшего анализа миллиардов страниц информации находящихся в базе поиска (индексе) поисковой машины. Вы получаете на первом экране Google всего 10 вариантов. Вы задумывались как это происходит? Как можно отобрать из бесконечного числа всего 10 результатов?

Существуют чисто математические расчеты, где учитывается количество текстовых вхождений вашего запроса во всевозможные документы. При этом учитывается «тошнота», когда ваш запрос фигурирует в тексте слишком много и это уже похоже на пере-оптимизацию – заточку документа под ваш запрос. – Выдача фильтруется, чтобы можно было отсеять «нечистых на руку» создателей сайтов.

Учитывается контекст в который входит ваш запрос, и учитывается тематика сайтов конкурирующих в выдаче по вашему запросу исходя из данного контекста. Выбирается наиболее близкий по тематике сайт, на котором расположен документ. И выдача фильтруется снова, так, чтобы по запросу «аллергия» в первую очередь учитывались медицинские профессиональные сайты и затем только принимаются в расчет, например, блог о рыбалке, в котором только одна запись про аллергию.

Учитывается популярность вашего запроса во времени, которая оказывает влияние на выдачу с учетом такой же выдачи по такому же запросу год назад или месяц назад. Принимается во внимание долгосрочный трэнд, сезонный трэнд. И один и тот же запрос “ёлка” летом даст вам одни 10 результатов, а в канун нового года выдача будет пересортирована и отфильтрована так, что вы получите 10 других результатов.

Учитывается новизна информации и её уникальность. И если раньше учитывались только количественные показатели вроде процента совпадения слов выстроенных в таком же порядке, то теперь поисковая машина частично понимает смысл на уровне того, что родился в 1815 году и был рожден 1815 году это одно и тоже.

Учитывается то с какого сайта вы пришли в поиск и какой вы сделали после этого запрос, и если тема сайта совпадает с вашим запросом, это также учитывается как уточняющий контекст.

Также учитывается не посещали ли вы уже ранее похожие по тематике сайты, ведь Google знает почти каждый наш чих. Знает историю просмотров в youtube, знает с кем вы ведете интенсивную переписку и на какие темы. А также новая фишка Google +1 которая приводит к тому, что выдача приобретает персональный характер и результаты выдачи с сайтов, где ваши друзья нажали +1 поднимаются вверх и превалируют над теми, что с точки зрения математических фильтров более соответствуют запросу.

Так же учитываются данные Google Analytics которые говорят о том, насколько полезен тот или иной сайт. Если на некоем сайте люди проводят меньше 30 секунд и почти никто не делает переходы на нем вглубь по ссылкам – такой сайт не попадает в первые 10 результатов выдачи, уже на этом основании.

Учитывается время запроса и если в час ночи вы делаете запрос сельдь под шубой, то скорее всего вы хотите её заказать, а не найти рецепт чтобы начать готовить. И в выдачу попадают сайты ближайших к вам территориально служб доставки еды. Хотя если сделать тот же запрос днем вы получите больше рецептов.

Это лишь наиболее очевидные и самые простые фильтры, которых в реальности сотни. Google очень быстро думает и учитывает массу факторов, прежде чем выдать на экран 10 первых результатов выдачи. Семантическая-математическая выборка + географический фактор + временной фактор + выбор большинства людей + выбор ваших друзей + персонализация и заточка выдачи конкретно под вас и вот ваши 10 вариантов.

Искусственный интеллект дело далекого будущего? Очнитесь скептики! Добро пожаловать в реальность, которая происходит прямо сейчас! Количество информации перешло в качество!

Также есть фильтры которые исключают из выдачи сайты увлекающиеся рекламой, размещающие ссылки ведущие на сайты акцепторы никак не связанные тематически с сайтом донором. То есть исключаются сайты неблагонадежные с точки зрения логики, и это очень правильно.

Исключающих фильтров также сотни, они призваны очистить интернет от мусора. Ведь каждый сайт об автомобилях ссылающийся на другие сайты об автомобилях это хорошо. Это хороший благонадежный информационный узел. А сайт про медицину ссылающийся на пластиковые окна бросает тень недоверия как на себя, так и на сайт пластиковых окон. Это узел сомнительный.

Но вернемся ко взгляду с уровня Google, когда у них как на блюдечке с голубой каемочкой вся ситуация в целом и они могут на нее влиять. Как они влияют? Они могут регулировать информационные трэнды выдавая в выдачу что-то новое и полезное и убирая в конец выдачи что-то вредное и то, что приводит к деградации сознания. А вполне могут и наоборот.

Они могут рекомендовать вам в Youtube посмотреть что-то похожее на то, что вы смотрите, но более умное, а могут что-то похожее но более отупляющее. Все зависит от того как настроить фильтры выдачи. И какую заложить стратегию. Как сместить ваш вектор внимания вопрос уже не стоит.

Тем более, что помимо математических фильтров учитывается то, как повело себя большинство пользователей, которым была предложена одинаковая выдача по одному и тому же запросу и можно исключить из выдачи слишком популярный выбор, ведущий не туда куда бы хотелось, и поднять повыше то, что им нужно. Можно очень быстро создать аналогичный информационный контекст и информационный повод на заказ. Поверьте, копирайтеры могут всё!

Можно воспитывать аудиторию. Можно за 5 лет превратить миллионы людей в интеллектуалов или дегенератов с достаточно высокой эффективностью, будь у Google такие цели. Ну по крайней мере телевидение так именно и поступает, как вы все, конечно же знаете. Просто там выбор между каналами. А вот дегенератом вы будете в любом случае. Потому что другой цели у телевизора нет. И все телеканалы контролируются правительством страны.

Разве что у телевидения нет такого досье на пользователей, как есть у Google. Ведь практически они уже залезли в голову каждому имеющему почтовый ящик в системе. И Google знает о всех тенденциях и всех трэндах пользователей. Вот этот пользователь последний год проводит много времени на таких то сайтах, вот что он спрашивает в поиске, вот что он слушает из музыки, вот что смотрит из видео.

И уже вполне понятна устойчивая реакция пользователя на какой либо информационный вброс. Известно как он реагирует на те или иные новости. А специально созданный информационный контекст может запрограммировать его на совершенно конкретную стереотипную поведенческую реакцию. Процент гарантии очень высок. Ибо интернет всё еще считается объективным и независимым.

Как это работает? Если вы хотя-бы иногда смотрите видео на youtube, откройте Youtube и посмотрите на список предлагаемого к просмотру видео. Не правда ли, похоже на то, что первый результат это то, что вас интересовало всегда больше всего, следующие видео это по сути очень похоже на то, что вы недавно смотрели? А ниже идут те ролики которые рекомендую ваши друзья. А справа – рекомендуемые каналы. Это самое интересное, тут уже все зависит от вас…

И помните, что вы просто один из нейронов этого искусственного интеллекта, который сейчас должен обновить и укрепить синаптические связи системы Google … Но у вас пока еще есть свобода выбора! Пока еще есть.