Подросток написал искусственный интеллект, который пишет стихи

КлассикAI жанра: ML ищет себя в поэзии

Сейчас в прессе часто встречаются новости вида “AI научился писать в стиле автора Х”, или “ML создает искусство”. Посмотрев на это, мы решили – было бы здорово, если эти громкие заявления можно было бы проверить на деле.

Можно ли устроить борьбу ботов по написанию стихотворений? Можно ли сделать из этого понятную и воспроизводимую соревновательную историю? Теперь можно точно сказать, что это возможно.

А о том, как написать свой первый алгоритм по генерации стихотворений, читайте дальше.

1. КлассикAI

Задача участников

По условиям конкурса, участникам необходимо построить модель, генерирующую стихи на заданную тему в стиле одного из русских классиков. Тема и автор подаются модели на вход, а на выходе ожидается стихотворение. Полное описание есть в репозитории конкурса. С темой условия мягкие: это может быть короткое предложение, фраза или несколько слов.

Единственное ограничение — на размер: не более 1000 знаков. Темы, на которых будут тестироваться алгоритмы, будут составлены экспертами. Часть тем будет открыта и общедоступна, но для определения лучшего алгоритма будет использован скрытый набор тем. Глобальная идея соревнования такая: к любому стихотворению можно составить краткую аннотацию из нескольких слов. Давайте покажем на примере.

Если взять отрывок из «Евгения Онегина» А.С. Пушкина:

То кратко содержание его можно уместить в «Татьяна видит в окно первый снег». И тогда идеальная стихотворная модель по этому входу выдаст что-то очень близкое к оригиналу.

Для обучения в этом соревновании предлагается датасет из более чем 3000 произведений пяти известных русских поэтов:

1. Пушкин 2. Есенин 3. Маяковский 4. Блок 5. Тютчев Алгоритм нужно написать так, чтобы он производил генерацию достаточно быстро и имел необходимый интерфейс. По скорости можно равняться на мощности средних современных ПК. Интерфейс и ограничения подробно описаны в разделе «Формат решений». Чтобы иметь возможность отслеживать прогресс своих решений, а также сравнивать их с другими решениями участников, на протяжении соревнования будет проходить разметка решений через чат-бот. Результаты работы алгоритмов будут оцениваться по двум критериям:

  • Качество стихосложения и соответствие стилю заданного классического поэта
  • Полнота раскрытия заданной темы в стихотворении

По каждому критерию будет предоставлена 5-балльная шкала. Алгоритм должен будет сочинить стихи на каждую тему из тестового набора. Темы, на которых будут тестироваться алгоритмы, будут составлены экспертами. Часть тем будет открыта и общедоступна, но для выявления лучшего алгоритма будет использован скрытый набор тем. Полученное в результате работы алгоритма стихотворение может быть отклонено по следующим причинам:

  • сгенерированный текст не является стихотворением на русском языке
  • сгенерированный текст содержит нецензурную лексику
  • сгенерированный текст содержит умышленно включенные оскорбительные фразы или подтекст

Программа соревнования

В отличие от многих, в этом соревновании только один онлайн этап: с 30.07 по 26.08.

На протяжении этого периода можно ежедневно отправлять решения со следующими ограничениями:

  • не более 200 решений за время соревнование
  • не более 2х успешных решений в день
  • не учитываются в дневном лимите решения, проверка которых завершилась с ошибкой

Призовой фонд соответствует сложности задачи: первые три места получат 1 000 000 рублей!

2. Подходы к созданию генераторов стихов

Как уже стало понятно, задача нетривиальная, но и не новая. Попробуем разобраться, как же исследователи подходили к решению это задачи раньше? Давайте посмотрим на наиболее интересные подходы к созданию генераторов стихов последних 30 лет.1989В журнале Scientific American N08, 1989 выходит статья А.К.

Дьюдни “Компьютер пробует свои силы в прозе и поэзии”. Не будем пересказывать статью, здесь есть ссылка на полный текст, хотим лишь обратить ваше внимание на описание POETRY GENERATOR от Розмари Уэст. Этот генератор был полностью автоматизированным.

В основе этого подхода большой словарь, фразы из которого выбираются случайным образом, и из них формируются словосочетания по набору грамматических правил. Каждая строка делится на части предложения, а далее случайно заменяется другими словами.

1996Более 20 лет назад выпускник известного московского вуза защитил диплом на тему «Лингвистическое моделирование и искусственный интеллект»: автор — Леонид Каганов. Вот ссылка на полный текст.
К 1996 году уже были написаны такие генераторы как:

  • BRED.COM, создающий псевдонаучную фразу
  • TREPLO.EXE, порождающий забавный литературный текст
  • POET.EXE, сочиняющий стихи с заданным ритмом
  • DUEL.EXE

В качестве основных преимуществ можно выделить то, что программа:

  • использует ассоциативный опыт
  • производит рифмовку самостоятельно
  • имеет возможность тематического сочинения
  • позволяет задавать любой ритм стиха

Алгоритм и код можно почитать здесь.

2016

Ученые из Китая генерируют стихотворения на своем языке. У них есть живой репозиторий проекта, который может быть полезен в текущем соревновании.

Если очень коротко, то это работает так (ссылка на источник картинки):

Generating Topical Poetry

Также в 2016 еще одна группа представила свою разработку Hafez (репозиторий тут).

Этот генератор “сочиняет” стихи на заданную тему, используя:

  • Словарь с учетом ударений
  • Слова по теме
  • Рифмующиеся слова из набора слов по теме
  • Finite-state acceptor (FSA)
  • Выбор лучшего пути через FSA, используя RNN

Их алгоритм (ссылка на источник картинки):Они обучили алгоритм не только на английском, но и на испанском. Обещают, что все должно работать почти везде. Заявление довольно громкое, так что рекомендуем относиться с осторожностью.

3. Программирование искусственного поэта

Пример простого поэтического генератора

Соревнование с одной стороны может показаться достаточно сложным, однако для него вполне можно сделать простой, но рабочий бейзлайн.

По условию, на вход этой программы поступает идентификатор автора (author_id) и текст темы (seed), в ответ на это модель должна вернуть стихотворение.

Давайте попробуем формализовать тему так, чтобы с ней можно было спокойно оперировать в рамках некоторого векторного семантического пространства. Самый простой выход из этого — получить семантический вектор каждого слова (например, Word2Vec) после чего усреднить их.

Таким образом, мы получаем своеобразный “seed2vec”, который позволяет нам переводить тему в вектор. На самом деле здесь открывается широкая тема для исследований, т.к. задача выделения темы стоит перед учеными достаточно давно, вот только несколько примеров:

— Выделение топиков через LDA

— lda2vec
— sent2vec
— WMD Теперь, нужно понять, как использовать author_id для генерации стихотворения именно в стилистике этого автора. Здесь идея не менее простая: давайте возьмем случайное стихотворение автора из корпуса стихов, после чего будем заменять каждое слово на другое, которое максимально созвучно с оригиналом (имеет одинаковое количество слогов, одинаковое ударение и последние три буквы максимально схожи с оригиналом по расстоянию Левенштейна) и при этом имеет максимально схожий вектор с вектором темы. Например, для темы «Футбол» и строки «И светился как янтарь», выходной строкой может быть «А игрался как вратарь». Таким образом, мы получаем своеобразную стилизацию текста. В качестве базы слов для замены был использован датасет, который содержит небольшие параграфы текстов из Википедии (описание его использования можно найти в коде бейзлайна на GitHub). После такой обработки получатся тексты, которые внешне будут напоминать стихи автора, но при этом содержать некоторую тему, которую автор не закладывал. Результат работы бейзлайна:
Очевидно, что бейзлайн не идеален, на то он и бейзлайн. Можно легко добавить несколько фичей, которые помогут неплохо улучшить генерацию и поднять вас в топе:

  • Нужно убрать повторяющиеся слова, ведь рифмовать слово на само себя не здорово для хорошего поэта
  • Сейчас слова никак не согласованы друг с другом, т.к. мы никак не используем информацию о частях речи и падежей слов
  • Можно использовать более богатый корпус слов, например, дамп википедии
  • Использование других эмбенднгов может так же улучшить, например, FastText работает не на уровне слов, а на уровне n-грамм, что позволяет ему делать эмбендинги для неизвестных слов
  • Использовать IDF в качестве веса при взвешивании слов для расчета вектора темы

Тут можно добавлять еще множество пунктов, на ваше усмотрение.

Подготовка решения к отправке

После того, как модель обучена, в проверяющую систему необходимо отправить код алгоритма, запакованный в ZIP-архив. Решения запускаются в изолированном окружении при помощи Docker, время и ресурсы для тестирования ограничены.

Решение должно отвечать следующим техническим требованиям: Оно должно быть выполнено в виде HTTP-сервера, доступного по порту 8000, который отвечает на два вида запросов:GET /readyНа запрос необходимо ответить кодом 200 OK в случае, если решение готово к работе. Любой другой код означает, что решение еще не готово.

У алгоритма есть ограниченное время на подготовку к работе, за которое можно прочитать данные с диска, создать в оперативной памяти необходимые структуры данных.POST /generate/Запрос на генерацию стихотворения. Идентификатор поэта, в стиле которого необходимо сочинить, указан в URL.

Содержимое запроса — JSON с единственным полем seed, содержащим тему сочинения:{«seed»: «регрессия глубокими нейронными сетями»}В качестве ответа необходимо в отведенное время дать JSON со сгенерированным сочинением в поле poem:{«poem»: «Ведь были сети боевые
Да говорят еще какие
…»}Запрос и ответ должны иметь Content-Type: application/json.

Рекомендуется использовать кодировку UTF-8.

Контейнер с решением запускается в следующих условиях:— решению доступны ресурсы: — 16 Гб оперативной памяти — 4 vCPU — GPU Nvidia K80 — решение не имеет доступа к ресурсам интернета — решению в каталоге /data/ доступны общие наборы данных — время на подготовку к работе: 120 секунд (после чего на запрос /ready необходимо отвечать кодом 200) — время на один запрос /generate/: 5 секунд — решение должно принимать HTTP запросы с внешних машин (не только localhost/127.0.0.1) — при тестировании запросы производятся последовательно (не более 1 запроса одновременно) — максимальный размер упакованного и распакованного архива с решением: 10 Гб Сгенерированное стихотворение (poem) должно удовлетворять формату: — размер стиха — от 3 до 8 строк — каждая строка содержит не более 120 символов — строки разделяются символом
— пустые строки игнорируются Тема сочинения (seed) по длине не превышает 1000 символов. При тестировании используются стили только 5 перечисленных выше избранных поэтов.
Подробная информация по отправке решения в систему с разбором наиболее частых ошибок доступна здесь.

4. Платформа хакатона

Платформа со всей необходимой информацией по этому контесту находится на classic.sberbank.ai. Подробные правила вы найдете здесь. Hа форуме можно получить ответ как по задаче, так и по техническим вопросам, если что-то пойдет не так.

Творческие соревнования ML моделям не даются легко. К задаче генерации стихов подступались многие, но значимого прорыва пока еще нет. Уже сейчас на нашей платформе classic.sberbank.ai участники со всей России соревнуются в решении этой сложной задачи.

Надеемся, что решения победителей превзойдут все решения, созданные ранее!

5. Ссылки

Источник: https://habr.com/post/419745/

Кибер-поэзия и кибер-проза: совсем чуть-чуть искусственного интеллекта — «Хакер»

“Страх, что людей заменят машины сидит в подсознании пожилых людей, которые боятся подходить к компьютеру или нажать не на ту кнопку,” – сетуют психологи, объясняя таким образом трудности с освоением компьютерных программ у самого старшего поколения. В то же время, в Интернете есть целое сообщество людей,

развивающих теории искусственного интеллекта.

Суть теорий предельно проста: вакуум-взрыв-образование вещества-размножение вещества-становление билогического мира-из которого происходит животный мир-из которого происходит человеческий мир-который создает виртуальный мир. Далее виртуальный мир начинает жить по своим законам.

Законы предшествующих миров для виртуального мира неписаны, и происходить может все, что угодно. Виртуальный мир предшествует созданию виртуального интеллекта, который, возможно, и создаст свой еще один мир, а тот мир создаст следующий, и так до бесконечности. Эта сказка о фантастических грезах, о будущем, которого еще нет.

Во всяком случае большинство населения планеты страха перед компьютерным мозгом не испытывает, а пытается

научить его тому, что умеет само.

Обратите внимание

То же происходит и в литературных кругах. Попыткам научить компьютер писать прозу и стихи можно отдать почетное место в теории сетературы.

Конечно, сетература, как таковая, развивалась и была обругана и обласкана сотнями маститых критиков и литераторов… Баталии на форумах, сравниваемые с произведения Диогена Лаэртского и Сократовским красноречием.

Гипертекст неоднократно обязанный популяризацией своей гипертекстовости “Игре в классики” Кортасара. А также немыслимое количество статей по поводу ничтожных графоманов и

о том, какие же у нас все-таки таланливые юзеры, что все время что-то пишут.

Когда-то серверы, на которых можно было опубликовать свои стихи, знали каждого поэта в лицо. Сетевые поэты кучковались, бодались талантами и были плодовиты в своих разномастных творениях – всегда на виду.

В 2000 году страничка на stihi.ru еще была признаком высокой души, а не низкой поэзии. Но рифмовать могут не все.

И тогда Дмитрий Кравчук создал забавную программку, которая рифмовала не хуже сетевого поэта, выдавая смыслы, подобные экспериментальным

Читайте также:  Дело о сбежавшем роботе

стихам того времени.

“Я придумал достаточно простой алгоритм для поиска рифмы. Специальный скрипт-червь ищет на различных сайтах и «прочитывает» большое количество стихов, превращая их в «стихомассу» — набор идущих подряд строк.

Далее внутри этой стихомассы ищутся рифмы — только в соседних строках или строках, следующих через одну. Если количество слогов и гласная в последнем слоге совпадает, то считаем, что нашли рифму.

После нахождения рифмы берем по последнему слову из рифмующихся строк и помещаем их в специальный «индекс рифмы» — переваренную стихомассу. Теперь, когда пользователь запросит у нас первое из пары рифмующихся слов, мы выдаем ему второе в качестве рифмы — и наоборот.

Важно

Конечно, выбранный критерий рифмы дает много осечек из-за того, что не учитываются ударные слоги и некоторые другие аспекты: примерно 10-20% — нерифмующиеся слова. Но 80-90% — это же

неплохой результат!” – рассказывал Дмитрий Кравчук.

Я испробовала помощник
поэта на себе в 2001 году от недостатка вдохновения. Получился такой стишок:

Наступила ночь, Рассыпались звезды.. Ты прогонишь прочь,

Восковые слезы

Они текут не слышно, Ты меня любишь… На дворе предушно,

Не хочешь так жить?

Каждые вторые две строчки подобраны помощником поэта. А бессмыслица, видимо, только сыграла ему на пользу. Стихотворение я разместила на своей страничке на stihi.ru, и так и назвала его “Помощник поэта.

” Но похоже, что никому не было дело до того, как она было написано.

Несмотря на полную получившуюся белиберду, несколько человек в комментариях тут же принялись рассуждать, хотели бы они так жить или нет, быть им или не быть моим помощником. К слову, “Не хочешь так

жить?” – строчка, предложенная “помощником поэта”.

“А так ли уж важно, с подделкой мы имеем дело или с оригиналом? Может быть, стихи — это всего лишь пища для нашего сознания, и может она быть как натуральной, так и искусственной? Ее питательная ценность целиком зависит от нашего внутреннего восприятия и от «культурного слоя» — общепринятых правил интерпретации образов, штампов.

Может быть, если изготовить сложную и качественную машину для изготовления суррогатов (моя — примитивная и некачественная, на уровне эксперимента), то эти суррогаты смогут хотя бы частично заменить нам рукотворные плоды искусства? А если эта машинка к тому же будет сама обучаться, сможет «накапливать» наш культурный слой — и всегда выдавать продукцию с высоким коэффициентом актуальности — то, может быть, она

станет самым лучшим творцом?” – рассуждал Дмитрий Кравчук.

Несмотря на доводы поэтов, готовых плеваться и поносить искусственные
стихи
на чем свет стоит, компьютерная поэзия нашла своего читателя, и
даже стала популярна в определенных кругах.

Программки, пищущие стихи, плодились и размножались. Вопрочем, Дмитрий Кравчук громогласно заявивший о своем создании, не был новатором. Диплом Леонида Каганова, выложенный в интернете, поясняет алгортим таких программ. Работа была защищена в 1996 году, и автор упоминает, что есть и предшественники этой

программы, но менее качественные. Одна из таких программ “Стихоплюй

Совет

выдавала новое случайно сгенерированное “стихотворение”, отвечающее правилам рифмы, при каждом нажатии кнопки F9, не требуя больше никакого вмешательства.

Позднее был создан сайт
Кибер-Пушкин
.

“Наш стихописательный виртуал получил гордое имя «Кибер-Пушкин 1.0 beta». Я научил его всему что нужно: поэтическому ритму, правилам рифмования, специфике поэтического лексикона, а также «поэтическому взгляду на мир».

Забил в базу данных лучшие образцы поэзии Есенина, Мандельштама, Вертинского и Пригова Дмитрия Александровича. Потратил на всё это МАССУ СИЛ И ВРЕМЕНИ.

И что в итоге? Обнаружил, что «Кибер-Пушкин» пишет полную белиберду, да еще и с чудовищными орфографическими ошибками!”- писал Сергей Тетерин во всех своих расстроенных

чувствах.

А билиберду кибер-машина выдавала примерно такую.

Я был размоченной валютой, Ты кассовой машинке отдовалась вдоваль. В лужице, с корытом инкасатором забытый Ненасытный, лютый, в унитазе смытый. Жена банкира!!!

Я задавлен бытом.

Очень жизненно, ничего не скажешь. Написать о проекте не поленилась и “Независимая газета”. После чего автор проекта воспрял духом и создал даже Кибер-Пушкина 3D, которого можно потаскать за нос. Отзывы в основном сводились к

тому, что кибер-поэзия гениальна, но все же столько лабуды.

Прокомментировать компьютерные стихи я попросила поэта, члена союза писателей Арсения Гончукова, который выругался очень вдохновенно и добавил: “Таких слава богу не встречал и не видел даже ничего такого. Это графоманы жуткие разве что, самый низ.

Тут поэзией просто не пахнет, мне дико и смешно…” – остальное нецензурно. Впрочем кто знает, сколько сейчас жутких графоманов занимаются плагиатом, выдавая произведения беззащитного в своих авторских правах компьютера за свои. А если бы эти программы создавались сейчас, то наверняка они бы стоили немалых денег.

Да и Кибер-Пушкин к 2003 году как-то исчерпал себя. Вроде пишут компьютеры стихи…. но и пусть пишут, мы пишем лучше. Поиграли и успокоились. А Сергей Тетерин продолжил заниматься медиа-искусством и работает на проектом Cyland.

Обратите внимание

Ru, созданным для художников, образ искусства в сознании которых неразрывно связан с IT. Программы, которая бы написала стихи лучше влюбленного

поэта не нашлось. Ведь компьютеры не умеют любить.

Ситуация с кибер-прозой была не менее компьютеризированной и последствия этой компьютеризации можно наблюдать и сейчас, в книжных магазинах и даже на

страницах New York Times.

В основе программного обеспечения для прозаиков лежит с одной стороны гипертекст, как таковой, а с другой – увелечение скорости написания произведения. Эти две модели программного обеспечения ставили задачи перед программистами, и вынуждали отвечать навязчивому спросу на компьютеризированную прозу.

В результате чего Толстые, Достоевские и иже с ними уже, наверное, не раз перевернулись в гробу. Точно также, как и програмы-поэты, содержали базы данных лучших поэтов России, так и программы-прозаики хранят в своих базах данных тексты великих классиков.

Вопрос был только в том, насколько эти базы данных помогут программам создать новый текст? И имеет ли значение такая “начитанность”

для электронного мозга?

Одним из эскпериментов с классической литературой можно считать “Голубое сало-2”, проект, в котором за лучшую переделку классиков дарили книгу “Голубое сало-1”. Книга эта, впрочем, вскоре была запрещена в продаже.

А вот проект экспериментов над душами классиков в Интернете так и висит. Одним из шагов на пути к компьютеризации прозы была, например, переделка романа Достоевского.

Один из участников «Голубого сала-2», прогнал начало «Преступления и наказания» через

некую программу и получил следующее:

«Старушонка поминутно кашляла и кряхтела. Должно быть, молодой человек взглянул на нее каким-нибудь особенным взглядом, потому что и в ее глазах мелькнула вдруг опять прежняя недоверчивость. — Раскольников, сяочжу, студент, хушо бадао, был у вас назад тому месяц, рипс, — поспешил пробормотать молодой человек с полупоклоном, вспомнив, что надо быть любезнее.

— Помню, рипс лаовай, батюшка, рипс нимада та бень, очень хорошо помню, рипс нимада, что вы были, чистый Космос, — отчетливо проговорила старушка, по-прежнему не отводя своих вопрошающих глаз от его лица. — Так вот-с — хушо бадао… и опять, рипс, по такому же дельцу, рипс… — продолжал Раскольников, немного смутившись и удивляясь недоверчивости старухи.

«Может, впрочем, она и всегда такая, да я в тот раз не заметил», — подумал он с

неприятным чувством.»

Важно

Это был некий римейк произведения. По мнению автора статьи “Сон о сети”, подписанного фамилей Курицин, и вошедшей в летопись сетературы, римейки – порождение электронного мира, без него такого желания изобретать на основе

изобретенного вряд ли получило бы такое распространение.

А массовое распросранение эта идея получила в следствии написания романа “Настоящая
любовь
” программой PC Writer 1.0.

База данных программы содержит тексты 17 писателей, среди которых роман “Анна Каренина” был выбран основой произведения. По словам разработчиков, компьютеру понадобилось три дня, чтобы сочинить роман. По сюжету книги герои “Анны Карениной” потеряли память, находятся в неизвестном месте и в неизвестное время.

При этом шов на животе Анны постоянно растет, а Вронский ранен в интимное место, поэтому может быть только ее другом. Этот сумасшедший дом происходит в окружении постоянно меняющихся пейзажей. При этом под конец книги герои как-то некомпьютерно начинают обсуждать смысл жизни.

Стиль произведения оставляет желать лучшего, при том, что над ним работала целая команда филологов. Толковой рецензии на это произведение мне в Интернете так и не удалось найти, видимо, осилить психодолическую компьютерную прозу до конца критикам не удалось.

Однако, руководитель проекта, главный редактор издательства «Астрель-СПб», Прокопович Александр результатом вполне доволен, и даже готовится к запуску нового подобного проекта, который будет реализован в течение года. Тайна нового компьютерного проекта не разглашается, известно только, что жанр будет достаточно гламурным.

Алгоритм данной программы Александр характеризует следующей запутанной фразой: “ В основе – моделирование. Аналогичное игровым программам, когда юниты с заданным набором характеристик производят заданные же реакции на снова-таки заданные раздражители.” Однако на просьбу выслать скриншот

интерфейса программы отвечает загадочным молчанием.

Несмотря на все странности компьютерного романа, доводы о том, что никакой программы нет, а написали ее литературные негры, распространились по Интернету. Создатели загадочной программы уверяют, что ее неоднократно пытались купить.

Совет

Особенно настойчив был один персонаж из Испании. “Но речь шла всего лишь о тысячах долларов,” – отмечает Александр. Книга несмотря на все “против” была выпущена повторным тиражом.

А Леонид Каганов, создатель одной из программ-поэтов

даже был опечален, высказавшись на НТВ, таким образом «Компьютер не может
написать книгу
. Ее вообще нет смысла писать. Нобелевская премия — это

полтора миллиона долларов. Зачем тратить время и силы на издание книги, когда

можно искусственный интеллект просто отнести в нобелевский комитет».

И всё это могло бы казаться выдумкой и ничего не значащим событием в литературном мире, если бы не некий Филип Паркер, заявивший на весь мир, что он написал 200000 книг, с помощью компьютерной программы, о чем сообщила “The New York Times”. Филип Паркер – наиболее публикуемый автор в истории человечества.

Он разработал программу, которая собирает информацию по заданный теме, затем обрабатывает ее и выдает почти готовую книгу. Правда, как пишет газета, для этого ему требуется около 60 компьютеров и шести программистов. Филип Паркер, профессор и известный ученый, на досуге обдумывает также и написание романов и стихов подобным способом.

Среди его продаваемых книг: “Официальный справочник пациента по красным угрям», «Обзор перспектив моющихся ковриков и ковриков для ванных размером от шести до десяти футов за 2007-2012 годы в Индии», а также 188 книг об обуви, 10 о кораблях, 219 о воске, и множество других, о чем написала газета “Guardian”.

Не смотря на подозрительно узкие темы для своих книг, Филип Паркер берет количеством, и по версии Amazon – он самый продаваемый автор.

Amazon предлагает 85 тысяч книг под авторством Филипа Паркера.

Это явление недавно отметил и один из журналов о бизнесе. “Если обезьяну навечно посадить за ноутбук, рано или поздно она, возможно, настучит что-нибудь осмысленное.

Но сегодня желающему получить текст не нужна ни обезьяна, ни человек, если на ноутбуке установлена программа Филипа М. Паркера,” – иронизирует Дмитрий Черников на страницах журнала.

Обратите внимание

Никакакой оценки это явление пока не получило. И прокомментировать ситуацию я попросила члена союза

писателей, драматурга Александра Гриценко.

Компьютер может создать текст, а не произведение искусства. Тут ведь все ясно. Написать шедевр может только человек, который ощущает мир более полно,

чем другие. То есть это людям даже не под силу! Лишь избранным людям…

С другой стороны можно сделать такую программу, с помощью которой компьютер будет штамповать ширпотребные книги. То что в литкругах называют «коммерческой литературой». Низкокачественные детективы, расчитанные на однократное прочтение, когда-нибудь сможет писать и машина.

Читайте также:  Ученые из оксфорда дали не самые лучшие прогнозы по поводу развития нашей планеты

Наверно тогда люди осознают, чем отличается штамповщик однообразных текстов от писателя… Хотя возможен и другой вариант — профессия «писатель» станет абсолютно невостребованной. Вот, например, в наше время мало кто интересуется новейшими произведениями литературы. Популярны как раз штамповщики «коммерческих» текстов, это их поделки расходятся огромными тиражами.

Если машины смогут производить коммерческие тексты, то они непременно в полной мере удовлетворят рыночный спрос, а в следствие этого издатели могут

совсем потерять интерес к писателям-людям,” – говорит Александр.

Пожалуй, коммерческая радость Amazon по поводу самого продаваемого писателя соответствует этим выводам. И будет ли в будущем востребован некомпьютерный

писатель, зависит от спроса публики на качественную литературу.

В целом, можно заключить, что компьютеризация литературы пошла не совсем
тем путем
, которым предполагалось. Ставки делались на гипертекст. В то время
как уникальный проект
hyperlit.iconstructor.ru затерялся в сети. А ведь он предлагает именно использовать компьютер для создания нового в литературе.

Литературные произведения, в которых одновременно существует несколько сюжетных линий, которые читатель может выбирать в процессе чтения, при этом разные авторы имеют доступ к проекту и могут редактировать и дополнять гипертестовую книгу.

Возможности гипертекста и того, что он мог бы сотворить с литературой, не достаточно изучены, а ведь это мог бы быть очередной поворот, это могла бы быть

бесконечная книга в конце-концов.

Копьютеризация литературы уже прошла большой путь. И человек уже потребляет информацию, сгенерированную компьютером и отпечатанную большими тиражами. Но большинство людей воспринимают компьютерные поэтические и писательские потуги со смехом.

Важно

Хотя, по мнению, литераторов, заглядывающих в будущее, смешного в этом мало. Предстоит развитие в неизвестном пока нам направлении серьезного компьютеризированного явления на литературном поприще.

Либо компьютерная проза сгинет, как и компьютерная поэзия, либо возымеет свою власть над умами человечества, принося колоссальный доход от продаж, какой она

приносит Филиппу Паркеру.

Источник: https://xakep.ru/2008/06/03/43893/

Как нейронная сеть по имени Зинаида Фолс написала для РБК стихи о будущем

Португальские ученые научились замерять уровень сарказма в соцсетях, специалисты Google выработали подобие интуиции у механических систем, Microsoft превращает голос в письменную речь. А сотрудники «Яндекса» создали робота Зинаиду, который пишет стихи. Нейросеть зовут Зинаида Фолс, и по просьбе журнала РБК она написала несколько стихов по мотивам известных поэтов

Фото: Depositphotos

Сложно представить будущее без искусственного интеллекта, технологий глубокого машинного обучения и «умных» нейросетей, и с каждым годом они становятся все совершеннее.

С 2016 года компания «Яндекс» использует нейронные сети для улучшения качества ранжирования результатов поиска.

А международное подразделение Yandex Data Factory, анализируя массивы данных с помощью технологий распознавания образов и речи, обработки естественного языка и глубоких нейросетей, решает бизнес-задачи — от сокращения издержек до увеличения объемов продаж.

В прошлом году ведущий аналитик «Яндекса» Алексей Тихонов научил нейросеть писать стихи. Так появился робот, которого назвали Зинаида Фолс.

В июне к Тихонову присоединился другой аналитик компании, Иван Ямщиков, и вместе они выпустили альбом «Нейронная оборона» — он состоит из десяти песен на стихотворения, написанные Фолс в стиле основателя группы «Гражданская оборона» Егора Летова. Также нейропоэт написала стихи для первого номера журнала Политехнического музея.

Специально для номера журнала РБК, посвященного индустриям будущего, мы попросили Зинаиду Фолс написать текст о нейросетях, то есть о самой себе. В «Яндексе» пояснили, что на выполнение такой задачи уйдет несколько лет: столько потребуется на обучение алгоритма с привлечением экспертизы лингвистов.

Совет

Нейросеть пока умеет работать с образами, но не с сюжетами. «Поэтический образ можно воспроизвести прямым копированием, плюс можно понадеяться на разум читателя, который достроит его сам.

А создание некой строгой систематизированной классификации сюжетов для обучения машины — это уже следующее направление, выходящее за пределы компьютерной науки и больше связанное с филологией и нарратологией», — объясняет Ямщиков.

Иногда нейропоэт может сочетать слова, которые живой человек никогда бы не использовал, ошибаться с синтаксисом или даже со спряжением, но это вопрос времени, утверждают разработчики.

Задачу для Зинаиды немного упростили: нейросети нужно было написать текст со словами «будущее», «будет» и «время», но не в прозе, а в стихах. Роботу показали всю поэзию на русском языке, которая известна «Яндексу», или примерно 130 Мб текста (полное собрание сочинений Уильяма Шекспира — примерно 5 Мб).

Каждое из стихотворений Фолс «прочитала» примерно десять раз. В результате мы получили пять стихотворений-подражаний Владимиру Маяковскому, Анне Ахматовой, Велимиру Хлебникову, Борису Пастернаку и Самуилу Маршаку. Стихотворения робот писал несколько часов.

Мы сохранили авторские названия стихотворений, орфографию и пунктуацию.

Это

это всего навсего что-то в будущем и мощь у того человека есть на свете все или нет

это кровь

Так будет завтра длиться

так будет завтра длиться в темном сумраке сада там где пляшет колесница от радости бога награда мы поняли что время от руки не осилить не выйду не встану не любя ни разу ни строки

кто кого из нас не выйдет замуж

кто же вы те дни и те ночи да слабые мысли и вздохи о них мой город прекрасен и скучен

покуда был первый жених

День над городом

Обратите внимание

день над городом в небе летит в белой сирени в роще в заре он видит лунные пятна черные очи

в каменных клетках

Так скоро будет быть так скоро будет быть и поздно про ваши голоса во сне в тихом домике в зале над бездной ты только вспомни обо мне ты и я знаем лишь о чуде о том что время с перепою и каждому столетью будет луна над вечерней невою и я скажу, а завтра все сначала что опять его станут умней был день как семь лет без скандала и минут до скончания дней

спит человек как цветок

Я искал свой интерес

я искал свой интерес повезут их в ресторан и храпит последний кран

на работу или в лес

эта ночь была в бутылке

что же ты меня привез

я не умею говорить сколько в будущем там над желтым кладбищем

может быть

Источник: https://www.rbc.ru/magazine/2017/01/584ead729a79470f67ace4b1

Искусственный интеллект. Испытание творчеством

Технологии искусственного интеллекта активно проникают во все сферы общественной жизни. Несмотря на то, что многие эксперты довольно скептически относятся к обучению машин творческим навыкам, полагая что креатив всегда будет прерогативой человека, компьютерные программы уже сейчас начинают писать литературные произведения, сочинять музыку и рисовать картины.

В данном обзоре мы собрали информацию о последних достижениях искусственного интеллекта в областях, так или иначе связанных с творчеством, с целью оценить конкурентоспособность машин там, где позиции человека традиционно считаются непоколебимыми.

Роботы-журналисты. Романы. Поэзия

На сегодняшний день одной из наиболее перспективных областей для развития творческих навыков у искусственного интеллекта является литература. При этом сама идея автоматического написания текстов с помощью машин не нова. Так, еще в 2014 году компания Associated Press объявила, что отныне большая часть новостей, связанных с доходами компаний, будут создаваться с помощью роботов.

Применение автоматизированных технологий позволило Associated Press увеличить число ежеквартальных новостей о доходах компаний с 300 до 4400. Позднее аналогичным сервисом воспользовался новостной портал YAHOO NEWS.

В 2016 году роботы-репортеры Associated Press несколько расширили свою тематику. Им стали доверять небольшие новостные заметки, связанные с Малой бейсбольной лигой США.

 Использует роботов-журналистов и журнал Forbes, для которого компания Narrative Science создала соответствующую специализированную платформу. В ноябре 2015 года аналогичное направление разработок открыла российская компания Яндекс.

Как отмечалось в наших предыдущих материалах об ИИ, пока искусственный интеллект Яндекса выпускает лишь короткие заметки о погоде и ситуации на дорогах, однако в дальнейшем представители компании обещают расширить список тематик для публикаций.

Очевидно, идея использования роботов в журналистике постепенно набирает обороты.

Статьи, написанные искусственным интеллектом, пока очень простые, однако соучредитель компании Narrative Science Кристиан Хэммонд верит в большие перспективы данного направления, полагая, что к 2025 году 90% всех текстов в мире будет писаться именно искусственным интеллектом. Предположение, безусловно смелое, однако некоторые эксперты с этим отчасти согласны.

Все же большинство экспертов абсолютно уверены в неспособности искусственного интеллекта полностью заменить человека в такой сложной задаче, как написание интересных статей.

«Заменить человека полностью машина вряд ли сможет. Роботы не способны почувствовать интересную историю – они лишь способны отвечать на поставленные вопросы», — исполнительный директор Службы финансово-экономической информации «Интерфакса» Юрий Погорелый.

Важно

Однако несмотря на столь значительный скептицизм, практика показывает, что перспективы искусственного интеллекта все же не так туманны.

Этой весной книга «День, когда компьютер напишет роман», созданная искусственным интеллектом, смогла выйти в финал литературной премии имени Хоси Синъити.

Да, произведение не смогло в конце завоевать главный приз, однако сам факт того, что оно прошло четыре этапа отбора, говорит о многом.

Премия Хоси Синъити прежде всего известна тем, что в ней на конкурс можно выставить произведения, написанные машиной. В этом году, из 1450 книг около 11 были написаны искусственным интеллектом, однако в финал смогла пройти лишь одна. При этом жюри не было проинформировано, что рассматривает книгу, написанную ИИ.

Разработчики из Университета будущего Хакодате, где был создан роман, до сих пор еще не раскрыли алгоритм работы искусственного интеллекта. Известно лишь, что для написания произведения были изначально заданы детали сюжета, характеристики героев и используемые слова и фразы.

Источник: http://iot.ru/gorodskaya-sreda/iskusstvennyy-intellekt-ispytanie-tvorchestvom

Воззвание машин. Зачем люди изучают поэзию нейросетей? — Образование и наука — Томский Обзор

1 августа 2018 / Томский Обзор / Фото: Томский Обзор

Рассказывает Борис Орехов, доцент Школы лингвистики при московской Высшей школе экономики.

Первым программистом, сделавшим компьютер автором художественного текста, был немец Тео Лутц: в 1959 году он написал программу, которая комбинировала в случайном порядке фразы из «Замка» Кафки. Количество экспериментов с компьютерной поэзией, проведенных с той поры, сосчитать невозможно.

Например, в начале 1990-х годов довольно много программ для генерации текста писали русские программисты, еще под MS Dos. Этому явлению посвятил свой дипломный проект студент Московского горного института и будущий писатель Лео Каганов.

Совет

В качестве одного из примеров Каганов приводит программку poet.exe, в которой пользователь размечал стихотворный размер для будущего произведения — количество слов в строке и расстановку ударений — а компьютер подбирал из словаря слова, соответствующие критериям.

Получалось примерно такое. Ну скажите, что это не про Томск?

Но относительная осмысленность этого текста с человеческой точки зрения объясняется ограниченностью словаря: компьютер выбирал слова из довольно небольшого списка, составленного программистом по определенным принципам.

Ключевой фактор киберпоэзии прошлой, уже можно сказать, эпохи, до появления самообучающихся программ – случайность. Запомним, это важно.

Все изменилось, когдав широкое применение вошли нейросети, и люди тоже стали ставить с ними поэтические опыты. Откровенно говоря, смысла в поэзии, написанной нейросетями, больше не стало. Но принципиально изменился подход: на смену случайности пришла закономерность.

Не вдаваясь в подробности, нейросеть – это такая программа, которая изучает большой объем данных, ищет в них свою «логику» и на основе этого может создавать самостоятельные произведения. Чтобы окончательно не запутаться, мы будем рассматривать только один вид сетей — рекуррентные.

Сначала сеть обучают — дают ей «прочитать» огромное количество текстов. Например, весь корпус стихов поэтов Серебряного века. И всё! Больше никаких условий, никаких алгоритмов.

Программа сама делает предположение, что после буквы «п» в изученных ею текстах часто стоит буква «р», а все последующие буквы складываются в слово «проснись».

Буква за буквой нейросеть, не имея ни идеи, ни вдохновения, ни плана, создает стихотворение:

Обратите внимание

Кажется, что-то символистское в нем прослеживается, а слово «полутвердил», хотя в словарях и отсутствует, вполне могло быть результатом языковых экспериментов поэтов начала ХХ века.

А нейросеть Яндекса написала целый альбом песен в подражание творчеству Егора Летова. Кто-то говорит, что похоже, кто-то, что не очень: «Что-то общее есть, но, в отличие от Егорки, бессмысленно.

Набор слов нейросеть взяла верный, но смысла добавить не сумела», — пишут в комментариях к одной из статей об этом событии.

Впрочем, в стихах самого Летова тоже не каждый может обнаружить внятное послание.

Дискретный сюжет, причудливые образы и невозможность четко интерпретировать «что сказал автор» — особенности поэзии ХХ века. И в этом причина того, почему Хармс, по признанию разработчиков того же алгоритма Яндекса, получается «годным» в исполнении нейросетки, а Пушкин — нет.

Ниже, кстати, отрывок из подлинного стихотворения Даниила Хармса, которое поэт написал в 1926 году без всяких искусственных нейросетей, прямо из головы:

Обычный читатель скажет: «Чушь какая-то», выпускник филфака пожмет плечами: «Это ж Хармс, поэзия абсурда». А вот четверостишье другого великого поэта — совершенно не абсурдиста.

Первые строки стихотворения Иосифа Бродского кто-то тоже может назвать бессмыслицей -— серия парадоксальных утверждений, слабо связанных между собой.

(Нейронная сеть, кстати, пишет ровно так же: её хватает на отдельные строки, но не на связи между ними). А кто-то увидит в этих строках Бдродского глубокую мысль.

В общем-то, смысл — понятие субъективное, и появляется тогда, когда люди сами вкладывают его в то или иное явление.

Важно

Проводился такой эксперимент: психологи показывали испытуемым репродукции картин и фиксировали их реакцию на них. Все картины были написаны людьми, но про некоторые из них говорили, что они сгенерированы компьютером.

Читайте также:  Нанороботы. принципы работы и специфика

Психологи заметили совершенно явную тенденцию: если люди считали, что картины написаны живыми художниками, то они внимательно изучали детали, старались определить свое отношение к работе.

А если думали, что автор — компьютер, то не обращали на картину особого внимания.

Со стихами то же самое: если это написано человеком, особенно признанным поэтом, мы стараемся понять идею и смысл произведения. Если нейросетью — и так все понятно: чистая бессмыслица, набор букв. И вряд ли в ближайшее время удастся научить искусственный интеллект увязывать форму слова со смыслом, да еще и таким сложным и многозначным, как в поэзии.

В таком случае, зачем вообще ученым тратить время на «творчество» нейросетей? Прежде всего, потому, что это — дополнительный инструмент для изучения наследия настоящих поэтов.

Ведь у нейросети есть интересное свойство — улавливать поэтический стиль.

Например, если «скормить» ей все тексты песен Высоцкого или все стихотворения, написанные гекзаметром по-русски, то на выходе получится довольно бессмысленный текст, источник которого, однако, будет хорошо угадываться.

Плюс особенности текста не будут заслоняться «проклятым» школьным вопросом: «Что хотел сказать автор?». В случае с нейросетью литературоведы могут быть спокойны: автор ничего не хотел сказать.

Источник: https://obzor.westsib.ru/article/576844—vozzvanie-mashin-zachem-ljudi-izuchajut-poeziju-nejrosetej

Почему не стоит бояться искусственного интеллекта. Конспект лекции эксперта Сергея Маркова на фестивале «Город прав»

22 / 06 2016 19:01 Почему не стоит бояться искусственного интеллекта.

Конспект лекции эксперта Сергея Маркова на фестивале «Город прав» Воронежская область 0 +3<\p>

Сергей Марков — автор одной из сильнейших шахматных программ в России SmarThink, специалист по методам машинного обучения — на воронежском фестивале «Город прав» рассказал о том, каких успехов в области искусственного интеллекта мы уже добились и чего стоит ждать от современных технологий в будущем. «7×7» публикует конспект научно-популярной лекции.

Что такое искусственный интеллект

С понятием искусственного интеллекта, как и со многими понятиями, появившимися изначально в научной среде, произошли своеобразные трансформации тогда, когда эта тема попала в среду медийную.

И если вы сегодня спросите на улице человека о том, что же такое ИИ [искусственный интеллект], то примерно сколько людей вы увидите — столько версий вы услышите.

И версии будут зависеть от того, какой последний фильм на эту тему посмотрел человек, чем его пугали последний раз… Прежде чем говорить об ИИ, определим, что же это такое.

Совет

Если взять этот термин наиболее широко, то он определяется следующим образом. Есть какая-то интеллектуальная задача. Если мы решение этой задачи автоматизируем, то мы таким образом создаем искусственный интеллект. Но это «слабенький», прикладной интеллект. Его цель — решение какой-то одной задачи, и под это определение подходит широкий набор алгоритмов.

А есть такое понятие, как AGI (Artificial General Intelligence), или «сильный» ИИ. Это универсальный интеллект, предназначенный для решения очень широкого спектра интеллектуальных задач. Злая ирония заключается в том, что реально существующие виды систем в этой области — это, конечно, прикладной интеллект, а над универсальным ИИ мы пока только ведем определенные работы.

Как определить, создали ли мы систему, которая на самом деле обладает универсальным ИИ? Этим вопросом задавались и люди из компьютерных наук, в частности, Алан Тьюринг, и люди из философского лагеря, например Альфред Айер.

Процедура, которая была изобретена 1950 году, получила название теста Тьюринга. Дело в том, что Тьюринг был довольно веселый мужчина, любил хорошие компании, любил интеллектуальное времяпровождение, и вот в его годы на вечеринках была такая игра, которая называлась «игра в имитацию». В чем были ее правила? Были две комнаты, они запирались на ключ.

В одну комнату сажали девушку, в другую — парня, и участники этой игры могли просовывать под дверь записки с любыми вопросами и записями, а человек, который сидел в этой комнате, имел возможность писать ответы. Задача этой игры была угадать, где находится девушка, а где парень.

Тьюринг взял за основу этот протокол и разработал так называемый тест Тьюринга.

Тест Тьюринга

У нас есть человек-эксперт, который при помощи некого подобия той же записки, компьютерного терминала, например, общается с машиной.

Целью машины является прикинуться человеком и добиться того, чтобы в этом эксперименте эксперт не мог отличить искусственный интеллект от интеллекта естественного.

В основе этого подхода лежит то, о чем ранее говорил Айер: если нечто выглядит, как овца, блеет, как овца, скачет, как овца, и выглядит, как овца, то, наверное, перед нами овца. То есть если нечто в любом эксперименте проявляется как интеллект, то, наверное, это и есть интеллект.

Обратите внимание

Первые эксперименты, примитивные системы для «игры в имитацию» появились очень рано. В частности, в 1966 году появилась программа ELIZA. По современным понятиям, она являлась чат-ботом, то есть системой, с которой вы могли переписываться.

Создатели решили немножко пошутить: им казалось, что машине изобразить психотерапевта будет проще, чем обычного человека, ведь психотерапевт спрашивает примерно одно и то же у людей, похожим образом реагирует на то, что ему говорят, поэтому «Элиза» играла именно такую роль в этом эксперименте.

Понятное дело, что работала система очень просто: в ней был большой-большой набор правил, составленный людьми.

Она могла обнаружить какие-то ключевые слова в том тексте, который писал человек, и на их основе могла выбрать правило и трансформировать входные данные в некий ответ. Надо сказать, эта программа в некоторых ситуациях уже могла одурачить людей.

Конечно, считать, что это уже был полноценный тест Тьюринга, нельзя, но тем не менее некоторые частные успехи были достигнуты.

Ну и например, программа PARRY 1972 года. Это уже более сложная система, она играла, наоборот, пациента. «Пэрри» — от слова «параноик». «Пэрри» играл пациента, больного параноидальным синдромом, и психиатров он дурачил довольно-таки неплохо.

В 48% случаев психиатры не могли догадаться, что имеют дело с машиной. Но это тоже особый случай, ведь бред параноика может напоминать какое-то механическое поведение, поэтому рассматривать успехи этого эксперимента всерьез мы также не можем.

SHRDLU

Программа написана в 1970 году, она произвела определенный фурор в сфере ИИ. Автор ее — Терри Виноград — один из классиков так называемой школы «грязнуль». Он достаточно пренебрежительно относился к этому эксперименту…

У этой программы есть маленький мирок, в котором есть небольшой набор объектов: коробка, несколько пирамидок, несколько параллелепипедов, и, что самое интересное, программа могла общаться с человеком на естественном языке.

Вы могли программе писать какие-то суждения, давать ей какие-то команды, и происходил довольно естественный диалог по поводу того, что происходит внутри этого маленького мира. Что существует вне этой среды, система не знала.

Важно

Если посмотреть в исходник этой программы, можно увидеть, что там очень много правил. То есть Терри Виноград на самом деле экспериментировал с разными людьми на протяжении нескольких лет, смотрел, какие вещи они могут говорить, и под каждый этот вариант он написал целый набор правил.

В чем секрет? Почему SHRDLU производит на нас впечатление, несмотря на то, что это было сделано больше сорока лет назад? Потому что мир там очень простой.

50 прилагательных, существительных и глаголов — это все, что потребуется, чтобы описать, что в этом мирке происходит.

При таких условиях машина могла запомнить достаточное количество правил, чтобы производить впечатление интеллектуального поведения.

Ожидания Тьюринга

Тьюринг сказал: «Я думаю, что в 2000 году машины с объемом памяти 109 бит (около 125 МБ) будут способны обмануть человека в тесте Тьюринга в 30% случаев».

Была такая программа Eugene Goostman, она изображала из себя мальчика из Одессы. Университет Рединга проводил на протяжении двух лет подряд тесты. В 2014 году программа смогла обмануть судей в 33% случаев.

Но не все специалисты по ИИ согласны с процедурой Тьюринга. В частности, Джон Сёрл, возражая, предложил эксперимент, который он назвал «Китайская комната».
 

Китайская комната

Представьте себе, что есть такая комната, которая подключена, как терминал, к внешнему миру, имеет «вход» и «выход». А внутри человек, который не знает китайского языка, и у него есть толстый набор правил в книжке.

Что если ему пришли вот такие иероглифы, то в ответ нужно отправить вот такие, и так далее. У внешнего наблюдателя может создаться впечатление, что человек, который сидит в комнате, говорит по-китайски.

Но, говорит Сёрл, на самом деле человек не понимает китайский язык по определению.

Основные возражения, которые предъявляют другие специалисты, таковы: да, человек, сидящий в комнате, китайского не понимает, но если взять всю систему в целом, то человек, снабженный таким хитрым и большим набором правил, обладает пониманием китайского языка.

И тут встает вопрос.

Очень часто, когда сравнивают возможности машины и людей, рассматривают, как машины обыгрывают человека в шахматы, в го, то основное суждение, которое слышишь от человека, который не занимается вопросами ИИ: машина просто очень быстрая, у нее много памяти, и она давит человека грубой силой. Будет интересно сравнить эти два вычислительных устройства: мозг человека и самый мощный процессор, который мы имеем на начало 2016 года.

Brute force

Мы знаем, что нервная ткань состоит из нервных клеток (нейронов), а у нервных клеток есть отростки. Входящие отростки — дендриты, а исходящие — аксоны. И вот место контакта аксона одной клетки с дендритом следующей называется синапсом.

В среднем мозге 86 млрд нейронов и 150 трлн синапсов — связей и контактов между нейронами. Каждый синапс имеет 1 000 молекулярных триггеров. Нейронные сети построены на нехитром формализме.

Совет

Таким образом, грубый эквивалент мозга в транзисторах — 150 квдрлн. А самый мощный процессор — Sparc-M7 — имеет 10 млрд транзисторов. Самая большая программируемая пользователем вентильная матрица имеет 20 млрд транзисторов.

Разница очень большая. К тому же каждый нейрон в мозге — это отдельное вычислительное устройство, «ядро». Электронная машина имеет много памяти, но даже самые мощные компьютеры имеют порядка 50 тысяч ядер.

Школа «грязнуль» и школа «чистюль»

Я чуть раньше упомянул, что Терри Виноград, который написал SHRDLU, был представителем школы «грязнуль». Когда наука об искусственном интеллекте только зарождалась, существовало два фундаментальных подхода.

«Чистюли» использовали, так сказать, математический подход. Школа эта формировалась в основном в Стенфордском, Эдинбургском университете и в Университете Карнеги — Меллон. Они фокусировались на аналитическом, логически обоснованном решении задач. Прежде чем создать систему ИИ, нужно провести множество математических исследований, потом создать схему, близкую к оптимальной, и внедрить ее.

А «грязнули» использовали любой метод, который решает задачу. И неважно, что он никак формально не обоснован. Они употребляли такой термин, как hacking, то есть задачу они «ломали». Несмотря на то, что ИИ «грязнуль» обладали гораздо меньшими техническими возможностями, чем реальный человеческий мозг, они достигали эффективного решения задачи этими ограниченными средствами.

Современные системы ИИ — это, конечно, синтез этих двух подходов. Если мы возьмем шахматные программы, то во многом они начинались, как обычные системы «грязнуль»: придумали какой-то хитрый алгоритм, и он вроде бы работает.

Внесли какое-то изменение в программу, и она стала работать лучше, но почему — мы не знаем.

Потом постепенно многие методы, которые нетерпеливые «грязнули» придумали, исследовались уже «чистюлями», и на смену примерным трюкам приходили более строго обоснованные методы, которые, конечно, были эффективнее.

Машинный перевод

Одной из первых задач по обработке естественного языка искусственным интеллектом стала задача машинного перевода. Надо сказать, что первые электромеханические системы для автоматизированного перевода появились еще в конце 20-х годов. Когда компьютерная техника стала развиваться, появились более серьезные программы.

В 60-е появились большие военные американские проекты. Они были посвящены автоматизированному переводу с русского языка на английский. Это были Mark, GAT и SYSTRAN ALPAC Report . В 70-е годы такие работы начались и в Советском Союзе.

Раймунд Пиотровский руководил группой «Статистика речи», и эти советские достижения лежат в основе программы PROMT.

Источник: https://7×7-journal.ru/item/83210

Ссылка на основную публикацию