Искусственный интеллект научится читать новости на сайте reddit

Искусственный интеллект

Искусственный интеллект подразумевает собой искуственно созданную машину, умеющую решать задачи с возможностью дальнейшего самообучения.

Впервые это словосочетание было использовано Джоном Маккарти в 1956 году, несмотря на то, что вопросы о разумных машинах поднимались и ранее.

Например в 1950 году один из пионеров в области вычислительной техники ученый Алан Тьюринг написал статью «Может ли машина мыслить?», в которой описал процедуру, определяющую разумность машины. В дальнейшем эта процедура получила название теста Тьюринга.

алгоритмыкиборгиэлектроникачеловек2

После череды поражений в различных интеллектуальных состязаниях и играх, человечество наконец смогло взять реванш у искусственного интеллекта. Хариш Натараджан победил систему «Miss Debater AI» от IBM во время конференции Think Conference в 25-минутном споре на тему субсидий для дошкольных учреждений.

Обратите внимание

Хотя слово «нейросеть» давно вошло в наш лексикон, сами эти системы недоступны большинству пользователей. Во-первых, они слишком сложны в эксплуатации и малопригодны для широкого применения. Во-вторых, требуют изрядных вычислительных мощностей для своей работы. Однако недавно был запущен сайт…

9

Человечество вовсю торгует в онлайн-пространстве и совершает покупки в автоматизированных виртуальных магазинах, зачастую не задумываясь – а кто выступает продавцом? Кто отвечает за ценники на товары? Еще в 2015-ом минимум треть всех сделок на Amazon обслуживали специальные торговые алгоритмы — по сути,…

1

Американская компания McCormick, известная во всем мире, как производитель различных приправ и пищевых добавок, последние 4 года работала совместно с IBM над созданием искусственного интеллекта под названием ONE. С его помощью она уже разработала несколько новых специй — для курицы по-тоскански, свиной вырезки с…

1

Извечный спор о том, сумеет ли робот заменить человека на реальной творческой работе, перешел на новое поле для противостояния. Речь идет о сфере мастеринга – финальной и самой сложной обработки музыкальных треков перед запуском их в тираж. Эта услуга может стоить от нескольких сотен до нескольких десятков тысяч…

4

Человечество еще крайне далеко от создания универсальных нейроинтерфейсов вида «мозг–компьютер», но ученые уже неплохо справляются с отдельными задачами. Мы можем собрать массу данных о сигналах в мозге, но как именно их интерпретировать? В прошлом году канадские специалисты разработали алгоритм распознавания лиц…

17

Международная группа исследователей систем машинного обучения и искусственного интеллекта пришла к неутешительному выводу – они более ограничены, чем мы полагали. Это проистекает из математической природы их архитектуры и методов работы. Согласно «Теореме о неполноте» Геделя и положениям его же Второй теоремы, в…

В погоне за искусственным интеллектом американские военные специалисты вовсе не собираются начинать с нуля. Так, агентство DARPA предложило создать несколько разновидностей роботов с ИИ на основе мозга насекомых.

Бостонская компания FDNA, специализирующая на внедрении интеллектуальных технологий в медицину, разработала инструмент Face2Gene. Его задача – анализировать изображения лиц детей, чтобы выявлять на них признаки генетических отклонений. Речь идет о скрытых проблемах, которые относятся к редким случаям, и потому трудны…

Важно

Один из ведущих мировых разработчиков графических ускорителей и процессоров, американская компания NVIDIA представила модуль искусственного интеллекта Jetson AGX Xavier, предназначенный для управления роботами.

2

Одни аналитики говорят, что все начнется уже в 2019-ом, другие рассуждают о «близком будущем», но все они сходятся в одном – фальшивые, поддельные «люди» заполонят информационное пространство. Речь идет о виртуальных моделях, которые будут выглядеть неотличимо от живых реальных людей, но выполнять то, что им укажет…

1

Сегодня нет нужды лично или при помощи сотрудников обзванивать потенциальных клиентов, рекламируя свои услуги. За малую мзду с этими справятся многочисленные колл-центры, где активно применяют цифровые технологии, как для охвата максимума аудитории, так и для автоматизации процессов. Только в США официально трудится 3…

В рамках медиа-конференции Social Media Week бренд Lexus представил свою новую концепцию развития автомобилей класса люкс. Теперь рекламный ролик «Driven by intuition» опубликован и в Интернете, а в его описании указано, что сценаристом выступил искусственный интеллект. Это соответствует самой сути рекламы и идеи…

2

Для того чтобы заниматься разработкой новых приложений для нейронных сетей и систем искусственного интеллекта, было бы неплохо иметь их под рукой – хотя бы для промежуточного тестирования своего кода. Увы, большинству рядовых пользователей это не по карману — поэтому в Intel разработали платформу для создания и…

1

Государственное информационное агентство Китая Синьхуа анонсировало скорый запуск нового проекта по круглосуточному вещанию новостей с автоматическим дубляжом с китайского на английский язык. Его главная особенность – зачитывать новости будут не люди, а их виртуальные коллеги, цифровые модели под управлением…

Это событие не станет сделкой века, но определенно войдет в историю развития интеллектуальных систем. На престижном лондонском аукционе Christie's официально продана первая художественная картина, написанная нейронной сетью. Точнее, группа французских креативщиков под названием «Obvious» показала пример, как при…

4

Уже ни первое десятилетие ученые пытаются идентифицировать хотя бы один сигнал, посланный представителями иных цивилизаций. Трудность заключается в высоком уровне шумов, практически полностью забивающих сигналы из космоса. И тут на помощь ученым пришел искусственный интеллект.

0

Совет

Исследователи из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института опубликовали описание новой технологии компьютерного зрения. Детально ее представят на конференции по обучению роботов в Цюрихе, в октябре. Но уже сегодня понятно, что это прорыв – такого робота не…

Подделка голоса или монтаж видео с участниками, которых не было в кадре, де-факто прошлый век. В Университете Беркли представили пилотную технологию, которая может заставить любого человека станцевать произвольный танец. На мониторе компьютера, разумеется, указав модели персонажа выполнять различные сложные движения.

В новостных программах для сокрытия личности некоторых людей применяют простейшие технологии – пикселизацию изображения и искажение голоса. Это позволяет передать суть того, а чем говорит субъект, но не его персональные эмоции относительно предмета беседы. А они порой бывают не менее важны, поэтому в Университете…

Несколько лет назад компании-гиганты IT всерьез увлеклись разработкой чатботов с псевдоинтеллектом, так как это сулило массу преимуществ. Из тех, что лежат на поверхности: сокращение персонала из живых людей для обслуживания клиентов, улучшение качества услуг, новые маркетинговые схемы. На практике же получили падение…

2

В первых числах августа в Сиэтле пройдет выставка, на которой будут показаны картины победителей конкурсов RobotArt за последние три года. Их отличает общий признак – все эти рисунки созданы роботами. Не без участия человека, но именно машина, искусственный интеллект, смешала краски и нанесла их на холст. И в ряде…

Компания Babylon представила на заседании британского Королевского медицинского колледжа свою новую разработку — чатбот с искусственным интеллектом, который способен применять методику сбору анамнеза и делать прогнозы относительно состояния и заболеваний пациента. Babylon настаивает на проведении официального…

2

Еще в январе текущего года власти префектуры Канагава объявили о планах первыми в стране внедрить систему прогнозирования преступлений. С тем, чтобы к Олимпиаде 2020 в Токио уже развернуть экспериментальную сеть сбора и обработки данных во всем регионе. Теперь у концепции есть идейный лидер, аналитик Мами Каджита, и…

Читайте также:  К 2017 году в китае будет использоваться более 500 тысяч роботов

Компания IBM начала разработку искусственного интеллекта для дебатов в 2014-ом, как отдельную ветвь развития «машинного мышления», в противовес системам с точным расчетом. Компьютер Deep Blue, который в 1997-ом победил Гарри Каспарова в игре в шахматы, действовал в строгом поле правил. AlphaGo победил в условиях игры…

Обратите внимание

Система распознавания движущихся объектов за препятствиями посредством Wi-Fi-эхолокации появилась не вчера, но теперь ее обслуживание поручили нейронной сети. С новыми алгоритмами все преобразилось – возникла технология, которую назвали RF-Pose. Она не «видит» человека за препятствием, но может распознать, кто это, и…

2

В Массачусетском Технологическом Институте поселился «Норман» – новый искусственный интеллект, которого назвали в честь персонажа из культового фильма «Психо» Хичкока 1960 года. Этот ИИ с самого начала целенаправленно обучали распознавать сцены насилия, смертей, убийства и страдания людей, включая и варианты в…

Благодаря машинному обучению с использованием ИИ, автоматическое наблюдение становится все более эффективным. Проект британских и индийских ученых продемонстрировал новые возможности этой технологии — в частности, он позволяет выявлять в толпе агрессивно настроенных лиц с помощью беспилотников.

Вопрос конфиденциальности данных является тонким, и людям всегда будут нужны инструменты для защиты личных сведений. Этим озаботились инженеры-программисты из Университета Торонто, которые разработали специальный фильтр для персональных фотографий. Теперь вы можете распространять свои снимки в Интернет свободно, ни…

1

Специалисты в области IT-технологий из Токийского университета разработали интересное приложение на основе искусственного интеллекта, обладающее отменным чувством гармонии и вкуса – Imaginary Soundscape. Его основное предназначение – подбирать загруженному изображению подходящее звуковое сопровождение.

Исследователи из Вашингтонского университета надели на голову аляскинского маламута видеокамеру GoPro, а на лапы и хвост – датчики положения в пространстве. В такой экипировке собака приняла участие в записи 380 коротких клипов с демонстрацией поведения животного в различных ситуациях. Эти данные легли в основу…

Источник: https://www.techcult.ru/tag/artificial_intelligence

Искусственный интеллект научится читать новости на сайте Reddit

Обрабатывать информацию на новостных сайтах вскоре будет искусственный интеллект. Это облегчит работу модераторов и полностью исключит необходимость в сложных затратах человеческого труда. Новые разработки подобного рода ведутся с новостным сайтом Reddit.

Для справки: Reddit создан в 2005 году – это новостной социальный проект, в котором каждый зарегистрированный пользователь имеет возможность опубликовать собственную статью, принимать участие в обсуждениях понравившихся тем, оставляя свои сообщения. За время работы сайт собрал 234 млн. читателей, которые минимум дважды в день посещают его, обеспечивая 542 миллиона просмотров. Это позволило занять проекту 11 место в рейтинге самых популярных. В мировом рейтинге у него 25-я позиция.

Теперь анализ новостных статей, выпускаемых на социальном сайте Reddit, будет выполнять компьютер DGX-1 с искусственным интеллектом, который распознаёт человеческий язык. Новый контактный суперкомпьютер имеет большое количество процессоров, способных одновременно выполнять необходимые вычисления. Эта новинка разработана компанией Nvidia и пригодна для машинного обучения.

Работа над сайтом стала задумкой Илона Маска, которой он дал название OpenAl. Этот некоммерческий проект исследований запущен в 2015 году. Чтобы воплотить его в жизнь, понадобились усилия и профессионализм 3000 человек, три года времени и 2 млрд. долларов. Вычислительная мощность умной машины – 170 терафлопс. Об этом вещает MIT Technology Review.

Как будет выглядеть работа?

Машина DGX-1 сможет работать по ранее заложенным в неё алгоритмам, анализируя содержание всех публикаций сайта. Разработчики думают, что именно это научит искусственный интеллект понимать язык людей. В дальнейших планах – обучение тому, как применить эти навыки в процессе общения с собеседниками.

Важно

Можно ли будет достичь желаемых результатов, покажет время. В данный момент исследования только начались. Пока алгоритм обучения для нового детища выстраивается методом проб и ошибок.

Специалисты надеются, что смогут научить суперкомпьютер не только плодотворному общению с живыми собеседниками, но и всем работам, которые необходимы в домашнем хозяйстве. Возможно, робот сможет украсить досуг людей, успешно играя с ними в различные игры.

Главный специалист исследовательского отдела Илья Суцкевич дал разъяснения СМИ о том, что их главная цель – создать такое искусственный интеллект, который будет способен выполнять максимально сложные задачи при отсутствии большого опыта.

Источник: https://neuronus.com/news-tech/1137-iskusstvennyj-intellekt-nauchitsya-chitat-novosti-na-sajte-reddit.html

Искусственный интеллект научили создавать веб-сайты

В компании Microsoft научили искусственный интеллект создавать веб-сайты. Исследователи из Microsoft Azure создали программный инструмент, который преобразует эскизы пользовательского интерфейса в html- код с использованием искусственного интеллекта (ИИ). Новый сервис Sketch2Code может упростить процесс разработки веб-страницы, опираясь на идею дизайна, набросанного на листе бумаги.

Sketch2Code с использованием облачных сервисов Microsoft Azure и исходный код программного инструмента выпущен под свободной лицензией в Github.

Как искусственный интеллект создаёт веб-сайты

Как работает сервис? Преобразование эскиза в код выполняется в пять шагов. На первом пользователь загружает снимок эскиза интерфейса в облако Azure. После этого технология компьютерного зрения пытается распознать какие HTML элементы пользователь изобразил и их координаты.

Затем технология обнаруживает текст в ранее распознанных элементах, а алгоритм компоновки использует пространственную информацию для всех граничных элементов для создания сети, в которой она будет находиться. Механизм генерации кода использует все собранные данные для создания HTML-дизайна проекта.

Ключевым элементом системы является модель компьютерного зрения Microsoft. Она предварительно обучается расшифровывать вручную нарисованные эскизы веб-страниц с инструкциями по наиболее распространенным элементам HTML, таким как кнопки, поля ввода текста, изображения и т. д.

Искусственный интеллект наделяют новой силой

Microsoft пытается не только заставить искусственный интеллект превращать человеческую творческую работу в понятную компьютерам форму. Специалисты компании готовят ИИ обучать компьютеры самостоятельной деятельности. Например, в начале этого месяца компания обучила популярный в Азии чат бот XiaoIce писать китайскую поэзию на основе показанных изображений.

С этой целью Microsoft создала нейронную сеть из двух частей. Одна распознает изображение и создает стихотворение, а другая оценивает его. Если результат с точки зрения алгоритма хорош, стихи отображаются человеку, и он их проверяет. При необходимости параметры корректируются до тех пор, пока стихотворение не будет одобрено. Таким образом система самообучается и усовершенствуется.

Искусственный интеллект ученые, не думая о будущем наделяют, новой силой. Теперь ИИ обучили не просто создавать веб-сайты по эскизам. Машины научили самообучаться на основе анализа результата и улучшать себя.

Но, как машина может совершенствоваться без моральных основ, которые имеет человек? Какой злой гений в недрах микросхем может уродиться без управления человека? Гонка технологий не оставляет времени на ответы разработчикам опасных для человечества технологий.

Источник: http://bag-info.ru/iskusstvennyj-intellekt-nauchili-sozdat-veb-sajty/

Искусственный интеллект научился читать лучше человека

Электронный разум теснит человеческий: победил в шахматы, «Свою игру», го, а теперь еще и выиграл тест на понимание прочитанного текста

Читайте также:  Ученые создают мораль для роботов будущего

Сразу две версии искусственного интеллекта, созданные компаниями Alibaba и Microsoft, впервые опередили человека в понимании смысла текстов. Об этом сообщил Стенфордский университет, который разработал университет. Означает ли это, что искусственный интеллект действительно превзошел человеческий?

Суть теста — семантический анализ текста, то есть разбор предложения на части и установление связей между соседними предложениями, понимание смысла текста.

Чтобы проверить, насколько хорошо усвоен материал, после «прочтения» всех статей могут быть заданы такие вопросы, как, например, «Кто и где убил Пушкина?» или «Что общего между фильмами «Крид» и «Стражи Галактики»? (Ответ: «И там, и там играл Сильвестр Сталлоне).

Средний процент правильных ответов у людей — 82,30%, а нейросеть от Alibaba показала результат в 82,44%, творение Microsoft — 82,65%.

Сложность прохождения теста в том, что в вопросе могут использоваться не те слова, что в исходном тексте, а для ответа будет нужно задействованы сложные смысловые связи между статьями. Как же так вышло, что софт обогнал человека?

В первую очередь важно обратить внимание на то, что тест проводился на текстах из Википедии. Очевидно, почему. Во-первых, данные Википедии доступны для обучения.

Во-вторых, они энциклопедичны, в них отсутствует эмоциональная окраска, и это упрощает задачу искусственному интеллекту и усложняют ее человеку — люди быстрее запоминают тексты и события, которые имеют эмоциональную окраску.

Совет

Здесь кроется ответ на вопрос, почему на людях, участвующих в тесте, не был получен 100%-й или близкий к 100%-му результат: если проводить тесты на текстах другого стиля, например, на художественных произведениях, возможно, ИИ справился бы с ними хуже человека. Попробуйте спросить машину: «Опиши чувства Наташи Ростовой на первом балу», и она не ответит.

Также важно помнить, что приведена средняя цифра, а человеку свойственно забывание части информации, особенно если она однообразна и поступает интенсивно (мозг притупляется, взгляд замыливается), ведь далеко не каждый из нас тренирует память для запоминания сухих текстов, цифр и связей между статьями. То есть, результат человека со специально натренированной памятью, очевидно, будет выше показанного в тесте.

И все же, результаты, которых ИИ удалось достичь на сегодняшний день, впечатляют и уже могут быть использованы для решения ряда бизнес-задач! Уже представили, что через год-другой искусственный интеллект будет объяснять вашим детям, почему у них пригорел пирог? Об этом поговорим чуть позже.

Если говорить о технической стороне вопроса, возникает логичный вопрос: почему ИИ раньше не обогнал человека и почему это произошло сейчас? Если углубляться в терминологию, то общество называет искусственным интеллектом последовательность матричных вычислений с оптимизацией функций ошибки и, несмотря на то, что теории нейросетей скоро исполнится 80 лет, никто до сих пор не знает, почему нейросеть обучается, почему всего два слоя нейросети ускоряют процесс приближения к целевой функции и минимизируют ошибку.

В математических моделях слои разного типа нейросетей можно совмещать друг с другом (в зависимости от задачи), подавая выход одного слоя на вход другого. При этом всю эту структуру нужно обучить на тестовых выборках и, чем сложнее структура нейростети, тем нужно больше времени и компьютерных ресурсов. А разработчикам необходимо удерживать в голове всю описательную сложность модели.

Также важно, чтобы модель могла хорошо распараллеливаться для работы на большом количестве процессоров и видеокарт. С появлением более мощных вычислительных устройств, а также больших наборов данных для обучения стало возможным натренировать нейросети с тысячами слоев за приемлемое время до того уровня, чтобы они могли обогнать человеческий мозг по ряду функций. Это и произошло 11 января.

Исследователи, работающие над созданием искусственного интеллекта, признаются в том, что нейросети для них являются черным ящиком, который при этом работает, и вполне успешно.

Они прекрасно обрабатывают информацию и даже могут генерировать совершенно новую, но всегда в рамках только одной понятийной области или одной задачи. Какую нейросеть создать под какие задачи, все еще каждый раз придумывает человек.

Обратите внимание

Разум позволяет нам создавать новое, ранее не существовавшую информацию, предметы, способен на базе накопленных знаний создавать принципиально новые. На это нейросети пока не способны.

Также важно понимать, что у человека нет простого интеллекта, у него интеллект эмоциональный (он понимает, например, радостная или печальная картина), что дает ему возможность решать более сложные задачи, чем те, которые решает ИИ.

Результаты, которые показали программы Alibaba и Microsoft, говорят о том, что уже появились программные продукты, способные полностью заменить человека при выполнении простых функций.

Показанный уровень понимания смысла текста дает компаниям, работающим с клиентами, возможность экономить миллионы долларов, снижать операционные издержки и минимизировать количество ошибок, допускаемых людьми. Они найдут применение в чат-ботах, колл-центрах, справочных, в системах обработки писем и обращений.

Все это можно будет поручить искусственному интеллекту, высвободив естественный (то есть нас с вами) для более сложных, нетипичных, критических обращений или решения уникальных вопросов, с которыми нейросети не справятся.

Например, Alibaba использует участвующую в конкурсе технологию на своем сайте Singles Day в качестве бота, помогающего покупателям. В результате и сам учился на реальных примерах, общаясь с пользователями. Это, к слову, также ограниченная область применения и заведомо ограниченный смысл общения.

В будущем искусственный интеллект призван забрать на себя те функции, которые скучны творческому человеку: сидеть на охране, смотреть целый день на картинки, читать весь день одни и те же тексты, целый день водить машину.

Возвращаясь к вопросу о сгоревшем пироге: как скоро ИИ сможет отвечать на подобные вопросы и появится ли по-настоящему интеллектуальный помощник? Если сделать нейросеть, которая будет обучена на рецептах и процессах приготовления пищи, а в качестве параметра выступит степень пригорания пирога, то решение этой задачи возможно в обозримом будущем. Может быть пара инвесторов в Долине уже вложили свой капитал в подобные разработки. А вот вкус эта нейросеть вряд ли сможет оценить. 

Источник: https://finovosti.ru/news/tekhnologii/iskusstvennyy-intellekt-nauchilsya-chitat-luchshe-cheloveka

Почему искусственный интеллект не смог бы (пока) написать эту статью

В свое время исследователь Роджер Шенк поставил задачу для искусственного интеллекта: компьютер должен посмотреть «Вестсайдскую историю» и распознать в ней сюжет «Ромео и Джульетты». Шенк и его ученики считали повествование отправной точкой для разума, мышления и понимания. По критериям Шенка современный ИИ не обладает разумом.

Статья «Чем занять обучаемые машины?» о возможностях ИИ — хороший пример того, на что компьютер пока не способен. Она написана двумя экспертами, которым понадобилось 20 лет, чтобы сформулировать гипотезу, собрать доказательства и изложить концепцию. Затем три редактора помогли им создать итоговый вариант статьи.

Тот факт, что ПО пока не пишет статей, не бросает тень на ИИ и его потенциал — но заставляет задуматься, как работает машинное обучение, что у машин получается хорошо, а что не очень, и как они будут развиваться, чтобы стать средствами создания текстов — или даже самостоятельными авторами.

Читайте также:  Робот-друг. такое возможно?

Много букв

Важно

Cегодня ИИ работает так: он формулирует задачи прогнозирования и решает их на основе статистических методов и больших данных. Простой пример текстовой задачи прогнозирования — автозаполнение. Когда я ввожу слово «как», мой телефон использует накопленные данные и статистические модели, чтобы угадать следующие слова. Он предлагает мне «сам», «ты» или «дела».

Я выбираю «дела» — и телефон гадает дальше. Теперь он уверен, что дальше последует «у» (он прав), и даже не показывает других вариантов, предлагая выбрать из «у тебя» и «у вас». Так работает контролируемое обучение.

Имея набор данных, содержащий нужный ответ (в данном случае — ранее написанные мною сообщения), алгоритм выявляет закономерности: например, что после «как дела» часто следует «у».

Процесс написания статьи невозможно (по крайней мере, пока) ­разложить на задачи прогнозирования.

На недавней конференции по ИИ и журналистике профессор Нью-Йоркского университета Сэм Боумен признал: «До полноценного создания длинных связных текстов без использования предельно четких журналистских шаблонов еще очень далеко».

Он отметил: хотя ученые доказали, что ПО может генерировать связные тексты по заданным параметрам, «в действительности создание систем, способных пройти весь путь от абстрактной идеи или набора фактов до длинного связного текста, все еще крайне непростая задача».

В доказательство Боумен приводит сценарий короткометражного фильма «Санспринг», написанного ИИ в 2016 году.

Для создания этого сценария нейросети (алгоритму машинного обучения) «скормили» несколько десятков сценариев научно-фантастических фильмов. Единицей данных для обучения алгоритма был текстовый символ.

Совет

Зная, какие символы уже использовались в тексте, алгоритм учился предсказывать следующие.

Впечатляет уже то, что сценарий состоит из реальных английских слов (пусть даже образующих странные фразы): до «чтения» сценариев нейросеть не только не умела писать тексты — она даже не знала английского языка. Программа выявила несколько характерных признаков сценария — таких, как распределение фраз по персонажам и наличие сценических ремарок. Это ей тоже удалось понять путем анализа множества текстов.

Однако программа не сумела на­учиться самому искусству повествования. В «Санспринге» отсутствует сюжет. Его герои существуют лишь в том смысле, что произносят какие-то реплики.

Этот эксперимент показал, какой долгий путь предстоит пройти ИИ, прежде чем он сможет рассказывать истории — то есть станет разумным по Шенку.

В то же время способность алгоритма складывать слова в предложения и выявлять основные свойства сценария говорит о том, что когда-нибудь ИИ ­можно будет использовать при написании текстов. Правда, в ближайшем будущем его роль будет довольно скромной.

Рефераты на заказ

Одна из сфер, где машинное обучение достигло значительного прогресса, — реферирование.

Поиск в тексте основных идей и составление краткой выжимки — очень частая задача: СМИ делают сводки последних новостей, корреспонденты предваряют репортажи обзором информации по теме, научные институты сжато излагают суть исследований, редакторы издательств резюмируют содержание книжных глав. Часть этой работы уже сегодня можно передать машинам: стартапы и ИТ-компании наперегонки пытаются создать для этого доступные инструменты и продукты.

Методы автоматического реферирования обычно делят на экстрактивные и абстрактивные. Экстракция — это поиск в документе самых важных предложений и объединение их в единое резюме.

Обратите внимание

Современные варианты этого метода весьма сложны, но исходную идею еще в 1958 году выдвинул Ханс Петер Лун из IBM.

Лун предположил, что ключом к содержанию документа могут стать слова, которые чаще всего в нем встречаются (не считая самых частотных, таких как предлоги и союзы). Таким образом, самыми репрезентативными в документе будут те предложения, где есть эти слова.

Если объединить их в один абзац, получится что-то похожее на краткое резюме текста. (Конечно, я упрощаю. Подробнее этот способ автоматического реферирования описали Кэти Маккиоун из Колумбийского университета и Ани Ненкова из Университета Пенсильвании.)

Метод абстракции работает иначе: алгоритм извлекает информацию из одного или нескольких документов и излагает ее в собственном оригинальном тексте.

Этот подход более перспективен, но до недавних пор он не давал впечатляющих результатов. Как показала история «Санспринга», создать текст с нуля очень сложно.

Однако прогресс, достигнутый в глубоком машинном обучении, возродил интерес к методу абстракции и позволил получить многообещающие результаты.

Чтобы понять, на что сегодня способно (и не способно) машинное обучение, сравните редакторское резюме статьи об ИИ с двумя машинными версиями — экстрактивной и абстрактивной (см. врезку «Три конспекта: человеческий, экстрактивный и абстрактивный»).

Первую версию написал редактор HBR. Она грамматически корректна, содержит основную идею статьи, и в ней используется третье лицо («авторы описывают…»).

Важно

Вторая создана методом экстракции и принадлежит прототипу, разработанному исследовательской организацией Fast Forward Labs. Используя реальные статьи и обзоры с сайта рекомендаций для чтения, команда Fast Forward обучила нейросеть оценивать вероятность включения тех или иных фраз документа в обзор.

Фразы, получившие самые высокие оценки, выстраиваются в том порядке, в каком они встречаются в исходном тексте, и образуют итоговый конспект. В данном случае самый высокий рейтинг получило предложение, начинающееся со слов «В наши дни важнейшей технологией широкого применения стал искусственный интеллект».

Этот тезис действительно можно считать исходным посылом статьи — здесь экстрактивный референт сработал хорошо. Но когда семь ключевых предложений были расположены в их исходном порядке, оказалось, что в первом есть неизвестно к чему относящееся местоимение «них».

(Обучить систему находить существительные, обозначаемые местоимениями, очень сложно, и прототип Fast Forward даже не пытался их искать.)

Третью версию конспекта предоставил профессор из Гарварда Александр Раш. Она получена методом абстракции. Раш обучил свою систему писать трехфразовые обзоры статей CNN, и хотя он отмечает несовершенство алгоритма, мы решили испытать ­программу­ на первых 450 словах статьи об ИИ.

«В принципе эта система абстрактивна, — поясняет Раш, — и может генерировать любые тексты. Но на деле она, похоже, в основном воссоздает фразы, которые видит в исходной статье». Другими словами, ее результаты не столь абсурдны, как «Санспринг», но и не столь оригинальны.

Как и экстрактивный конспект, абстрактивный содержит основные мысли статьи, но сообщает о «технологиях» без необходимых уточнений.

Достаточно ли хороши эти конспекты, чтобы заменить написанные людьми? Пожалуй, нет. Однако вопрос скорее в том, могут ли созданные ИИ наброски обзоров помочь людям в работе. И здесь можно уверенно ответить: да.

Искусственный секретарь-референт

Может показаться, что использование ИИ для реферирования не поможет людям в процессе написания текстов. Однако в сочетании с другими ­технологиями это облегчает важнейшую часть работы — поиск данных. Сбор информации — «самое сложное, что приходится делать автору», признает Дэвид Хилл, главный редактор научно-технического издания SingularityHub.

Источник: https://hbr-russia.ru/innovatsii/tekhnologii/767878

Ссылка на основную публикацию