Первый видеозвонок через спутник Starlink
Маркировка AI-контента от Google
Постквантовое шифрование в Zoom
Google Meet собирает звук с ноутбуков
Расшифровка нетипичной речи для конференций
Полноценная совместная работа в Zoom с любым контентом и инструментами
Аврал? Google и Microsoft нагенерируют вам виртуальных сотрудников
Показали работающий прототип системы выборочного шумоподавления
BYOAI — Принеси свой искусственный интеллект

Первый видеозвонок через спутник Starlink

SpaceX тестирует видеозвонки с помощью обычных никак не модифицированных Android-смартфонов через спутники Starlink с технологией Direct to Cell. Скорость соединения может достигать 17 Мбит/с. 

До конца года сервис могут запустить в США для клиентов T-Mobile в отдаленных районах, куда не достают вышки сотовой связи. Конкуренты уже нажаловались в FCC, призывают комиссию заставить SpaceX прекратить испытания — подробности.

Маркировка AI-контента от Google

Google показал инструмент SynthID — он маркирует специальными водяными знаками видео, аудио, изображения и текст, сгенерированные с помощью AI.

Специальные модели и алгоритмы встраивают маркировку прямо в контент, созданный искусственным интеллектом. В случае с текстом водяные знаки интегрированы непосредственно в процесс, который LLM-модель использует для генерации текста.

Постквантовое шифрование в Zoom 

Zoom внедряет по всему миру постквантовое сквозное шифрование E2EE для своих продуктов. Пока реализовано в Zoom Meetings, скоро появится в Zoom Phone и Zoom Rooms.

При определенных обстоятельствах злоумышленники могут перехватить зашифрованный сетевой трафик сейчас с намерением расшифровать его позже, когда квантовые компьютеры станут более продвинутыми — сценарий, который часто называют «собери сейчас, расшифруй позже»... Zoom занял активную позицию, обновив алгоритмы, разработанные для противостояния этим потенциальным будущим угрозам.

Постквантовое шифрование Zoom использует алгоритм Kyber 768 — механизм инкапсуляции ключей на основе модульной решётки в соответствии со стандартом FIPS 203, утвержденным Национальным институтом стандартов и технологий (NIST).

В феврале Apple добавил в iMessage постквантовый криптографический протокол PQ3. Signal использует PQXDH — постквантовый расширенный протокол Диффи-Хеллмана.

Google Meet собирает звук с ноутбуков

Если у вас нет нормального микрофона в переговорной или он сломался, Google обнаружит все ноутбуки в комнате и предложит объединить звук со встроенных микрофонов, а также синхронизировать динамики. Искусственный интеллект уберет эхо от нескольких устройств. 

Функцию назвали «адаптивное аудио», она включена по умолчанию. На боковой панели участники с объединенным звуком автоматически группируются. У пользователей есть возможность отключить опцию вручную.

Это большое преимущество для организаций, у которых недостаточно помещений для видеоконференций или нет ресурсов для закупки специального оборудования в конференц-залы.

P.S. Microsoft недавно в систему профессиональной многокамерной съемки добавил камеры личных ноутбуков, с которых могут подключаться участники в переговорной.

Расшифровка нетипичной речи для конференций 

Voiceitt обрабатывает произношение с акцентом и нарушениями различного происхождения.

Люди с особенностями речи записывают образцы — потребуется около 200 отрывков. Потом в течение нескольких часов формируется их собственный речевой профиль. Персональная модель постоянно дообучается в процессе общения. Есть поддержка команды логопедов.

Voiceitt доступен как надстройка для FaceTime, MS Teams, Webex и Zoom. Скоро обещают выпустить Chrome-расширение для работы в Google Classrooms, Google Workplaces и на других платформах через браузер. 

Результат расшифровки приложение выдает в формате онлайн-субтитров непосредственно в конференцию. Есть также отдельное приложение для взаимодействия с системами умного дома, надиктовки текстов. Для настройки предлагают бесплатный период на 1 месяц.

Полноценная совместная работа в Zoom с любым контентом и инструментами

Корпоративные надстройки для Zoom все еще актуальны — недавно вышло в свет приложение ProFeatures for Zoom. Фаундер образовательной платформы Blackboard Майкл Чейзен в 2011 году продал ее за $1,64 млрд, а позже сделал надстройку Class для Zoom, которая помогала педагогам вести занятия во время пандемии. К вопросу о том, что человек в отрасли не случайный.

От пользователей стали поступать недвусмысленные сигналы, что что-то похожее на Class пригодилось бы и для бизнеса.

Поэтому я попросил разработчиков взять наш продукт, отключить инструменты для обучения и оставить фундаментальные улучшения, которые мы внесли в Zoom

Что дает ProFeatures for Zoom:

  • совместное редактирование документов Microsoft Office и Google Docs, работа на доске Miro и над кодом в Microsoft Visual Studio — правами доступа на комментирование и редактирование можно управлять

  • если предложенных инструментов недостаточно, есть встроенный браузер, откуда можно работать с любым сайтом, приложением и контентом

  • участники могут открывать дополнительные вкладки параллельно с презентацией/экраном спикера и работать с ними по ходу встречи

  • есть умный ассистент ProFeatues AI, который расшифровывает собрание, готовит сводки и справки, при этом использует в своих ответах все доступные для работы документы и веб-контент, которым делились участники

Итого у разработчика есть две образовательные надстройки Class для Zoom и Microsoft Teams + бизнес-приложение ProFeatures for Zoom. 

Еще до официального старта ProFeatures было продано корпоративных лицензий на $17 млн. 

В одиночку его можно использовать бесплатно, но все преимущества становятся очевидными только в командной работе.

Аврал? Google и Microsoft нагенерируют вам виртуальных сотрудников

Google на базе AI Gemini предлагает создавать виртуальных коллег-ботов. Им выдают собственный профиль, имя, роль в команде и запускают в рабочие чаты.

Инструмент называется AI Teammate. Виртуальный участник виден всем, отвечает на вопросы исходя из доступного контекста, может делать сводки, готовить материалы и выполнять разные задачи. Ничего никогда не забудет и не пропустит.

Microsoft тоже сдает в аренду виртуальных сотрудников. В предварительной общедоступной версии Copilot Studio уже в этом году появится возможность создавать помощников с расширенным функционалом. Они кроме поговорить смогут брать на себя многоступенчатые несложные задачи, мониторить почту, вводить данные, отслеживать ход заявки. С точки зрения процессов это может быть техподдержка, адаптация новых сотрудников, работа с клиентами.

От сбоев и галлюцинаций будут защищать элементы управления: виртуальный сотрудник должен действовать в рамках инструкций по автоматизации задач. Активироваться такой агент сможет разными событиями, а не только сообщениями человека в чате.

Фокус AI смещается с поиска и обобщения информации на автоматизацию рутины, с индивидуальной переписки — на взаимодействие с группой людей. Новую функцию Team Copilot покажут позже в этом году. Помощник сможет модерировать командные чаты, назначать задачи, отслеживать сроки и повестку встреч.

Показали работающий прототип системы выборочного шумоподавления

Исследователи из Вашингтонского университета, про которых мы писали осенью, показали работающий прототип своих наушников с выборочным шумоподавлением. Новый алгоритм распознаëт и отсекает ненужные шумы, при этом никак не затрагивает и не изменяет нужные нам звуки, независимо от их частот. Распространенные же сейчас системы заглушают «шумные» частоты и вместе с ними искажают потенциально интересные для нас сигналы. 

Теперь нажатием кнопки можно находить голос конкретного человека и слушать только его, исключив все остальные шумы. Система обучена различать 20 типов звуков, включая будильники, плач младенцев и пение птиц. Каждую категорию можно заблокировать.

Обработка происходит локально, очищенное аудио поступает обратно с задержкой менее 8 миллисекунд. Команда считает, что технология уже может быть реализована на аудиоустройствах и готова к коммерциализации.

Здесь можно послушать сэмплы

BYOAI — Принеси свой искусственный интеллект

Оказывается, аж 75% работников умственного труда применяют ИИ-инструменты на работе, из них 46% начали это делать менее полугода назад. 

Руководители сомневаются в немедленной отдаче и эффективности вложений. Поэтому сотрудники пользуются чем попало без разрешения и держат это в секрете.

Посторонние сервисы применяют 78% пользователей ИИ. В основном такое происходит в малых и средних компаниях — 80%.

52% людей, использующих ИИ на работе, скрывают это.

53% беспокоятся, что их перестанут считать незаменимыми, раз они применяют алгоритмы для решения ключевых рабочих задач.

Источник: Microsoft, опрос 31000 работников интеллектуального труда в 31 стране, февраль-март 2024

Комментарии (5)


  1. virtualvoyager
    04.06.2024 09:44

    Жду день, когда ИИ пройдет собеседование, будет ходить на работу и получать деньги вместо меня


    1. cry_san
      04.06.2024 09:44

      Тратить он их тоже будет вместо вас

      А вообще напомнило мультик про хомяка и суслика "Приключения Хомы" (https://www.youtube.com/watch?v=Ul51K3o43Vs)


  1. dimitrii_z
    04.06.2024 09:44

    Первый видеозвонок через спутник Starlink

    С одной стороны связь по всему шарику без наземных вышек - это удобно и нормальный путь, только все спутники которые эту смваязь обеспечат увеличат число объектов на околоземной орбите. А их с учётом мусора уже и так довольно много https://habr.com/ru/articles/792120/ Не совсем понятно как с этим всем бороться..

    Google Meet собирает звук с ноутбуков

    Тут, конечно, с заголовком перемудрили, смысл же не в том что "постоянно" как можно подумать собирает. А только от участников. Теоретически звучит интересно, но как оно будет работать в опенспейсе где разные люди сидят в разных конфах, не понятно ) А в тепличных условиях (когда 3 человека в небольшой комнате) оно и так особо не нужно.


    1. iLyaSudi
      04.06.2024 09:44

      смысл же не в том что "постоянно" как можно подумать собирает. А только от участников.

      откуда вы знаете?


      1. dimitrii_z
        04.06.2024 09:44

        Это сильно просто было бы обнаружить: тем же Wireshark отследить трафик вне звонка.