• Первый видеозвонок через спутник Starlink
• Маркировка AI-контента от Google
• Постквантовое шифрование в Zoom
• Google Meet собирает звук с ноутбуков
• Расшифровка нетипичной речи для конференций
• Полноценная совместная работа в Zoom с любым контентом и инструментами
• Аврал? Google и Microsoft нагенерируют вам виртуальных сотрудников
• Показали работающий прототип системы выборочного шумоподавления
• BYOAI — Принеси свой искусственный интеллект
Первый видеозвонок через спутник Starlink
SpaceX тестирует видеозвонки с помощью обычных никак не модифицированных Android-смартфонов через спутники Starlink с технологией Direct to Cell. Скорость соединения может достигать 17 Мбит/с.
До конца года сервис могут запустить в США для клиентов T-Mobile в отдаленных районах, куда не достают вышки сотовой связи. Конкуренты уже нажаловались в FCC, призывают комиссию заставить SpaceX прекратить испытания — подробности.
Маркировка AI-контента от Google
Google показал инструмент SynthID — он маркирует специальными водяными знаками видео, аудио, изображения и текст, сгенерированные с помощью AI.
Специальные модели и алгоритмы встраивают маркировку прямо в контент, созданный искусственным интеллектом. В случае с текстом водяные знаки интегрированы непосредственно в процесс, который LLM-модель использует для генерации текста.
Постквантовое шифрование в Zoom
Zoom внедряет по всему миру постквантовое сквозное шифрование E2EE для своих продуктов. Пока реализовано в Zoom Meetings, скоро появится в Zoom Phone и Zoom Rooms.
При определенных обстоятельствах злоумышленники могут перехватить зашифрованный сетевой трафик сейчас с намерением расшифровать его позже, когда квантовые компьютеры станут более продвинутыми — сценарий, который часто называют «собери сейчас, расшифруй позже»... Zoom занял активную позицию, обновив алгоритмы, разработанные для противостояния этим потенциальным будущим угрозам.
Постквантовое шифрование Zoom использует алгоритм Kyber 768 — механизм инкапсуляции ключей на основе модульной решётки в соответствии со стандартом FIPS 203, утвержденным Национальным институтом стандартов и технологий (NIST).
В феврале Apple добавил в iMessage постквантовый криптографический протокол PQ3. Signal использует PQXDH — постквантовый расширенный протокол Диффи-Хеллмана.
Google Meet собирает звук с ноутбуков
Если у вас нет нормального микрофона в переговорной или он сломался, Google обнаружит все ноутбуки в комнате и предложит объединить звук со встроенных микрофонов, а также синхронизировать динамики. Искусственный интеллект уберет эхо от нескольких устройств.
Функцию назвали «адаптивное аудио», она включена по умолчанию. На боковой панели участники с объединенным звуком автоматически группируются. У пользователей есть возможность отключить опцию вручную.
Это большое преимущество для организаций, у которых недостаточно помещений для видеоконференций или нет ресурсов для закупки специального оборудования в конференц-залы.
P.S. Microsoft недавно в систему профессиональной многокамерной съемки добавил камеры личных ноутбуков, с которых могут подключаться участники в переговорной.
Расшифровка нетипичной речи для конференций
Voiceitt обрабатывает произношение с акцентом и нарушениями различного происхождения.
Люди с особенностями речи записывают образцы — потребуется около 200 отрывков. Потом в течение нескольких часов формируется их собственный речевой профиль. Персональная модель постоянно дообучается в процессе общения. Есть поддержка команды логопедов.
Voiceitt доступен как надстройка для FaceTime, MS Teams, Webex и Zoom. Скоро обещают выпустить Chrome-расширение для работы в Google Classrooms, Google Workplaces и на других платформах через браузер.
Результат расшифровки приложение выдает в формате онлайн-субтитров непосредственно в конференцию. Есть также отдельное приложение для взаимодействия с системами умного дома, надиктовки текстов. Для настройки предлагают бесплатный период на 1 месяц.
Полноценная совместная работа в Zoom с любым контентом и инструментами
Корпоративные надстройки для Zoom все еще актуальны — недавно вышло в свет приложение ProFeatures for Zoom. Фаундер образовательной платформы Blackboard Майкл Чейзен в 2011 году продал ее за $1,64 млрд, а позже сделал надстройку Class для Zoom, которая помогала педагогам вести занятия во время пандемии. К вопросу о том, что человек в отрасли не случайный.
От пользователей стали поступать недвусмысленные сигналы, что что-то похожее на Class пригодилось бы и для бизнеса.
Поэтому я попросил разработчиков взять наш продукт, отключить инструменты для обучения и оставить фундаментальные улучшения, которые мы внесли в Zoom
Что дает ProFeatures for Zoom:
совместное редактирование документов Microsoft Office и Google Docs, работа на доске Miro и над кодом в Microsoft Visual Studio — правами доступа на комментирование и редактирование можно управлять
если предложенных инструментов недостаточно, есть встроенный браузер, откуда можно работать с любым сайтом, приложением и контентом
участники могут открывать дополнительные вкладки параллельно с презентацией/экраном спикера и работать с ними по ходу встречи
есть умный ассистент ProFeatues AI, который расшифровывает собрание, готовит сводки и справки, при этом использует в своих ответах все доступные для работы документы и веб-контент, которым делились участники
Итого у разработчика есть две образовательные надстройки Class для Zoom и Microsoft Teams + бизнес-приложение ProFeatures for Zoom.
Еще до официального старта ProFeatures было продано корпоративных лицензий на $17 млн.
В одиночку его можно использовать бесплатно, но все преимущества становятся очевидными только в командной работе.
Аврал? Google и Microsoft нагенерируют вам виртуальных сотрудников
Google на базе AI Gemini предлагает создавать виртуальных коллег-ботов. Им выдают собственный профиль, имя, роль в команде и запускают в рабочие чаты.
Инструмент называется AI Teammate. Виртуальный участник виден всем, отвечает на вопросы исходя из доступного контекста, может делать сводки, готовить материалы и выполнять разные задачи. Ничего никогда не забудет и не пропустит.
Microsoft тоже сдает в аренду виртуальных сотрудников. В предварительной общедоступной версии Copilot Studio уже в этом году появится возможность создавать помощников с расширенным функционалом. Они кроме поговорить смогут брать на себя многоступенчатые несложные задачи, мониторить почту, вводить данные, отслеживать ход заявки. С точки зрения процессов это может быть техподдержка, адаптация новых сотрудников, работа с клиентами.
От сбоев и галлюцинаций будут защищать элементы управления: виртуальный сотрудник должен действовать в рамках инструкций по автоматизации задач. Активироваться такой агент сможет разными событиями, а не только сообщениями человека в чате.
Фокус AI смещается с поиска и обобщения информации на автоматизацию рутины, с индивидуальной переписки — на взаимодействие с группой людей. Новую функцию Team Copilot покажут позже в этом году. Помощник сможет модерировать командные чаты, назначать задачи, отслеживать сроки и повестку встреч.
Показали работающий прототип системы выборочного шумоподавления
Исследователи из Вашингтонского университета, про которых мы писали осенью, показали работающий прототип своих наушников с выборочным шумоподавлением. Новый алгоритм распознаëт и отсекает ненужные шумы, при этом никак не затрагивает и не изменяет нужные нам звуки, независимо от их частот. Распространенные же сейчас системы заглушают «шумные» частоты и вместе с ними искажают потенциально интересные для нас сигналы.
Теперь нажатием кнопки можно находить голос конкретного человека и слушать только его, исключив все остальные шумы. Система обучена различать 20 типов звуков, включая будильники, плач младенцев и пение птиц. Каждую категорию можно заблокировать.
Обработка происходит локально, очищенное аудио поступает обратно с задержкой менее 8 миллисекунд. Команда считает, что технология уже может быть реализована на аудиоустройствах и готова к коммерциализации.
→ Здесь можно послушать сэмплы
BYOAI — Принеси свой искусственный интеллект
Оказывается, аж 75% работников умственного труда применяют ИИ-инструменты на работе, из них 46% начали это делать менее полугода назад.
Руководители сомневаются в немедленной отдаче и эффективности вложений. Поэтому сотрудники пользуются чем попало без разрешения и держат это в секрете.
Посторонние сервисы применяют 78% пользователей ИИ. В основном такое происходит в малых и средних компаниях — 80%.
52% людей, использующих ИИ на работе, скрывают это.
53% беспокоятся, что их перестанут считать незаменимыми, раз они применяют алгоритмы для решения ключевых рабочих задач.
Источник: Microsoft, опрос 31000 работников интеллектуального труда в 31 стране, февраль-март 2024
Комментарии (5)
dimitrii_z
04.06.2024 09:44Первый видеозвонок через спутник Starlink
С одной стороны связь по всему шарику без наземных вышек - это удобно и нормальный путь, только все спутники которые эту смваязь обеспечат увеличат число объектов на околоземной орбите. А их с учётом мусора уже и так довольно много https://habr.com/ru/articles/792120/ Не совсем понятно как с этим всем бороться..
Google Meet собирает звук с ноутбуков
Тут, конечно, с заголовком перемудрили, смысл же не в том что "постоянно" как можно подумать собирает. А только от участников. Теоретически звучит интересно, но как оно будет работать в опенспейсе где разные люди сидят в разных конфах, не понятно ) А в тепличных условиях (когда 3 человека в небольшой комнате) оно и так особо не нужно.
iLyaSudi
04.06.2024 09:44смысл же не в том что "постоянно" как можно подумать собирает. А только от участников.
откуда вы знаете?
dimitrii_z
04.06.2024 09:44Это сильно просто было бы обнаружить: тем же Wireshark отследить трафик вне звонка.
virtualvoyager
Жду день, когда ИИ пройдет собеседование, будет ходить на работу и получать деньги вместо меня
cry_san
Тратить он их тоже будет вместо вас
А вообще напомнило мультик про хомяка и суслика "Приключения Хомы" (https://www.youtube.com/watch?v=Ul51K3o43Vs)