AWS представила потоки каналов в своем API для обмена сообщениями и видеоконференцсвязи Chime. Идея состоит в том, чтобы включить автоматическую модерацию ненормативной лексики или контента, который «не соответствует» корпоративному бренду.
Хотя Amazon Chime имеет относительно небольшую долю на переполненном рынке видеоконференцсвязи, Chime SDK удобен для разработчиков, создающих приложения, которые включают видеоконференцсвязь или обмен сообщениями, конкурируя с SDK и службами от Twilio или Microsoft Azure Communication Services. Другими словами, это нацелено в основном на корпоративных разработчиков, создающих приложения или веб-сайты, которые включают обмен сообщениями в реальном времени, аудио или видеоконференцсвязь.
Новая функция предназначена для текстового чата в реальном времени, а не для видео, и называется потоками каналов обмена сообщениями. Это позволяет разработчикам создавать код, который перехватывает и обрабатывает сообщения до их доставки. Предполагается, что этот код обработки будет работать на бессерверной платформе AWS Lambda.
В сообщении инженера-программиста Chime Manasi Surve более подробно объясняется идея этой функции. Все дело в модерации, и Surve описывает, как «настроить поток каналов, который удаляет ненормативную лексику и определенную личную информацию (PII), такую как номер социального страхования».
Далее она поясняет, что корпорациям необходимо предотвращать случайный обмен конфиденциальной информацией и что социальные приложения должны «обеспечивать соблюдение правил сообщества», а также избегать «контента, которым публикуются пользователи, который не соответствует их бренду». Предыдущий подход к той же проблеме работал только после публикации сообщения – слишком поздно во многих сценариях.
Показательно, что Surve отмечает, что «человеческая умеренность требует значительных человеческих усилий и не масштабируется».
Автоматизация всего – отличительная черта сегодняшних облачных гигантов, хотя автоматизация модерации не всегда была успешной.
Surve сказал: «Amazon Comprehend помогает устранить многие проблемы», поскольку эта услуга предназначена для обработки естественного языка и имеет возможность при соответствующем обучении обнаруживать «ключевые фразы, сущности и настроения» для автоматизации дальнейших действий.
Простой пример, представленный Surve, не использует Comprehend для ненормативной лексики, а «просто… список запрещенных слов», хотя она добавляет, что «вы также можете использовать Comprehend для ненормативной лексики, но вам нужно будет обучить свою собственную модель». Comprehend используется для определения номера социального страхования.
Пользователи умеют обходить автоматические фильтры, и мы подозреваем, что обучение Comprehend дезинфекции любого вида ненормативной лексики или небрендовых сообщений, которые может придумать пользователь, будет сложной задачей.
Существуют и другие возможные варианты использования потоков сообщений – например, автоматический поиск статьи поддержки, чтобы показать пользователю ссылку, отправка предупреждения или анализ настроений – хотя в этих случаях может не иметь большого значения, занимает ли обработка размещать до или после того, как сообщение будет отправлено другим пользователям того же канала. ®