Наука эмоций приобрела популярность относительно недавно, и во многом благодаря Полу Экману ― американскому психологу, автору книги «Психология лжи» и консультанту известного сериала «Обмани меня», который основан на материалах книги.
Сериал вышел в 2009 году, и в то же время сильно возрос публичный интерес к теме распознавания эмоций. Бум в стартап-среде произошел в 2015‒2016 годах, когда сразу два технологических гиганта ― корпорации Microsoft и Google ― предоставили для обычных пользователей свои пилотные проекты для работы с наукой эмоций.
Это стало стимулом к созданию самых разных приложений и алгоритмов на основе технологии распознавания эмоций. Например, Text Analytics API ― один из сервисов пакета Microsoft Cognitive Services, которые позволяют разработчикам интегрировать готовые «умные» алгоритмы в свои продукты. Среди других сервисов пакета: инструменты распознавания изображений, лиц, речи и многие другие. Теперь эмоции можно определять по тексту, звуку голоса, фото и даже видео.
Как работает технология распознавания эмоций?
Технология распознавания эмоций основана на анализе различных модальностей, то есть каналов передачи информации о человеческих эмоциях. Существуют два основных типа модальностей: контактные и бесконтактные.
Контактные модальности включают в себя измерение физиологических параметров человека, таких как пульс, давление, температура кожи, потливость и др. Для этого используются специальные датчики или носимые устройства, которые прикрепляются к телу человека. Контактные модальности позволяют определить не только эмоции, но и уровень стресса, аритмию или риск эпилепсии.
Бесконтактные модальности включают в себя анализ аудио- и видеоданных, полученных от микрофона или камеры. Для этого используются специальные алгоритмы, которые извлекают признаки из звука или изображения и сопоставляют их с определенными эмоциями. Бесконтактные модальности позволяют определить эмоции по мимике, голосу, речи или жестам.
Для того, чтобы технология распознавания эмоций работала эффективно, необходимо выполнить несколько этапов:
- Сбор данных. На этом этапе необходимо получить достаточное количество данных о человеческих эмоциях в разных ситуациях и условиях. Данные могут быть получены из разных источников, таких как телевидение, интернет, эксперименты или игры.
- Разметка данных. На этом этапе необходимо присвоить каждому фрагменту данных метку, соответствующую определенной эмоции. Метки могут быть основаны на разных моделях или теориях эмоций, таких как базовые эмоции (радость, грусть, страх, гнев, отвращение, удивление), дименсиональные эмоции (валентность, активация, доминирование) или категориальные эмоции (счастье, горе, стыд, вина и др.).
- Обучение модели. На этом этапе необходимо обучить компьютерную модель, которая будет способна распознавать эмоции по данным. Для этого используются различные методы машинного обучения, такие как нейронные сети, опорные векторы, решающие деревья и др.
- Тестирование и оценка модели. На этом этапе необходимо проверить работоспособность и точность модели на новых данных, которые не были использованы в процессе обучения. Для этого используются различные метрики, такие как точность, полнота, F-мера и др.
Где используется технология распознавания эмоций?
Технология распознавания эмоций может иметь множество применений в разных сферах:
- Медицина. Технология распознавания эмоций может помочь в диагностике и лечении различных психических и неврологических заболеваний, таких как депрессия, аутизм, биполярное расстройство и др. Также технология распознавания эмоций может помочь в мониторинге состояния пациентов, обеспечении им психологической поддержки и повышении качества жизни.
- Образование. Рассматриваемая технологияможет помочь в обучении иностранным языкам, проверке произношения, адаптации учебных материалов и методик к индивидуальным особенностям учеников. Также технология распознавания эмоций может помочь в оценке уровня знаний, мотивации, интереса и вовлеченности учеников в процесс обучения.
- Развлечения. Распознавания эмоций может помочь в создании интерактивных игр, фильмов, мультфильмов, аудиокниг и др. Также технология распознавания эмоций может помочь в поиске и рекомендации контента, переводе и субтитровании, синхронизации звука и изображения и др.
- Безопасность. Технология распознавания эмоций может помочь в идентификации и верификации личности по голосу или лицу, распознавании команд и запросов, мониторинге и анализе звуковой информации, обнаружении и предотвращении угроз и др.
Что ждет технологию распознавания эмоций в ближайшем будущем?
Технология распознавания эмоций имеет большой потенциал для трансформации всей экосистемы, всей техносферы. Она даст возможность людям общаться друг с другом более качественно, глубоко и полно с помощью гаджетов и с миром быстро «умнеющих машин» с человеко-компьютерным интерфейсом.
Технология способствует развитию взаимопонимания и эмпатии, поможет решить проблемы людей с ограниченными возможностями (например, с аутизмом) и найдет способы облегчения социально-критических заболеваний.
Однако не только технология важна, но и то, как её применяют люди. Мы полностью поддерживаем этический принцип и исходим из того, что система ограничений и балансов, включая законодательные, не сделает технологию распознавания эмоций технологией тотального надзора. Её задача ― помогать человеку, не нарушая его свободу, его права, его личное пространство. Конечно, отдельные отклонения неизбежны, но устраняемы.