Всем привет! На волне хайпа с chatGPT мне захотелось попробовать попросить нашумевшую нейронку сделать за меня работу писателя. Я потратил 10 минут и вот, что из этого вышло.

Ниже текст самой статьи. Без правок и редактуры, как сама сеть его сгенерировала по запросу "Напиши мне статью в стиле статей портала habr.ru на тему DDD в Python с использованием функционального программирования":

Hidden text

DDD (Domain-Driven Design) - это подход к разработке ПО, который сосредоточен на понимании бизнес-домена и его моделировании с помощью техник и шаблонов. Он позволяет разработчикам создавать программные системы, которые эффективно отображают и поддерживают бизнес-процессы.

 

В последнее время DDD широко используется совместно с функциональным программированием для улучшения читаемости, масштабируемости и сопровождаемости кода. Функциональное программирование предлагает множество инструментов для управления сложностью, а также подходящую модель программирования, которая легко совместима с концепциями DDD.

 

Одним из главных инструментов DDD является модель предметной области (Domain Model), которая отражает сущности и их взаимодействия в бизнес-домене. В функциональном программировании мы можем использовать чистые функции и иммутабельные объекты для моделирования наших сущностей, что помогает нам сохранять целостность и состояние данных в нашей системе.

 

Также в DDD есть концепция служб (Services), которые представляют собой некоторую логику, которая не принадлежит конкретным сущностям. В функциональном программировании мы можем вынести эту логику в отдельные чистые функции, что поможет нам улучшить тестируемость и уменьшить связанность между различными частями нашей системы.

 

Использование DDD вместе с функциональным программированием в Python позволяет нам создавать эффективные и гибкие программные системы, которые легко поддерживать.

Ниже приведен пример кода, демонстрирующий использование DDD и функционального программирования в Python. В данном примере мы моделируем сущность "Пользователь" и службу "Аутентификация".

 

from typing import Tuple

 

class User:

    def __init__(self, username: str, password: str):

        self.username = username

        self.password = password

 

    def __repr__(self):

        return f'User(username={self.username})'

 

def authenticate(user: User, username: str, password: str) -> Tuple[bool, User]:

    if user.username == username and user.password == password:

        return True, user

    return False, None

 

user = User("john_doe", "password123")

is_authenticated, authenticated_user = authenticate(user, "john_doe", "password123")

if is_authenticated:

    print(f"User {authenticated_user} is authenticated.")

else:

    print("Authentication failed.")

В данном примере мы создали класс User для моделирования сущности "Пользователь". Мы также создали чистую функцию authenticate для моделирования службы "Аутентификация". Функция authenticate принимает на вход объект User и данные для входа, и возвращает кортеж, содержащий результат аутентификации и аутентифицированный объект User, если аутентификация удачна.

Организация слоя взаимодействия с базой данных и веб-фреймворком по правилам чистой архитектуры и DDD может выполняться следующим образом:

 

1. Создание репозиториев: Репозиторий представляет собой слой, который отвечает за взаимодействие с базой данных. В этом слое определяются функции для доступа к данным, такие как выборка, создание, обновление и удаление.

class UserRepository:

    def get_user(self, user_id: int) -> User:

        # Code to fetch user from database

        pass

 

    def create_user(self, user: User) -> None:

        # Code to insert user into database

        pass

2. Создание слоя взаимодействия с веб-фреймворком: Этот слой отвечает за представление данных в веб-формате и выполнение действий, вызываемых пользователем. Например, если пользователь запрашивает данные о пользователе, этот слой будет использовать репозиторий для получения данных.

Структура проекта, построенного с использованием принципов DDD, чистой архитектуры и функционального программирования, может выглядеть следующим образом:

my_project/

|-- domain/

|   |-- __init__.py

|   |-- entities/

|   |   |-- __init__.py

|   |   |-- customer.py

|   |   |-- order.py

|   |-- use_cases/

|   |   |-- __init__.py

|   |   |-- customer_use_cases.py

|   |   |-- order_use_cases.py

|   |-- repository/

|   |   |-- __init__.py

|   |   |-- customer_repository.py

|   |   |-- order_repository.py

|-- infrastructure/

|   |-- __init__.py

|   |-- database/

|   |   |-- __init__.py

|   |   |-- database_access.py

|   |-- web/

|   |   |-- __init__.py

|   |   |-- web_framework.py

|-- main.py

Директория domain содержит код, относящийся к сущностям и бизнес-логике проекта. В директории entities находятся классы сущностей, такие как Customer и Order. Директория use_cases содержит код, описывающий использование сущностей в бизнес-логике. Директория repository содержит код, описывающий хранилище сущностей.

Для другого примера, пусть наш проект имеет два корневых пакета: app и infrastructure.

 

app пакет будет содержать все сущности, сервисы и интерфейсы нашего приложения. В данном случае, это может выглядеть так:

app

├── entities

│   └── order.py

├── services

│   └── order_service.py

└── interfaces

    └── order_repository.py

Пакет infrastructure будет содержать все внешние зависимости и инфраструктуру приложения, такие как базы данных, веб-фреймворк и другие слои. В данном случае, это может выглядеть так:

infrastructure

├── db

│   └── repository.py

├── web

│   └── views.py

└── middleware

    └── logging.py

repository.py будет содержать все функции взаимодействия с базой данных. views.py будет содержать все endpoint'ы, которые мы хотим предоставить для взаимодействия с веб-фреймворком. logging.py может содержать все необходимые методы для ведения логов.

 

В этом подходе, мы отделяем наши сущности и сервисы от внешних зависимостей, тем самым создаем проект с хорошей структурой и легкостью в поддержке и расширении.

Можно использовать функциональный подход в слое app, где мы можем использовать чистые функции для обработки данных и предоставления их в веб-фреймворк для отображения. Также мы можем использовать функциональные методы в слое database, где мы можем оперировать с данными в базе данных через чистые функции, которые обеспечивают целостность данных и высокую производительность.

В заключение, использование DDD, чистой архитектуры и функционального программирования в Python может дать нам мощный инструмент для решения сложных задач в разработке приложений. Это позволяет нам построить проекты, которые легко поддерживать и расширять в будущем, а также обеспечивает высокую производительность.

И вот тут мне хотелось бы немного порассуждать. Ресурса моего времени было потрачено около 10 минут. На выходе получился в целом сносный результат. Во всяком случае не хуже многих других обзорных статей по разным тематикам, которые мне доводилось читать на хабре за долгое время. Возможно, если я бы потратил еще пол часа, пообщался с нейросетью подробнее, то результат мог бы стать еще кратно лучше. Я мог бы попросить ее в конце добавить список рекомендуемой литературы по теме, чтобы это все выглядело еще убедительнее.

Сейчас эта нейросеть уже пишет дипломы, которые можно успешно защитить в типичном российском вузе. Stack Overflow уже запретил публиковать ответы, сгенерированные нейросетью. А что ждет порталы, вроде Хабра? Где огромное количество статей имеет обзорный характер о работе с какими-то технологиями, куча статей представляют из себя туториалы. При не большом ресурсе затраченного времени и chatGPT такой контент может начать появляться в неприличных масштабах. Может Хабру стоит быстрее задуматься о том, что ждет его, как портал в новых реалиях? Как Хабр сможет отличить рукописные статьи от сгенерированных?

Интересный вопрос, на который хотелось бы услышать ваше мнение в комментариях ниже. Кто мы, пользователи и писатели Хабра и куда мы идем? Или куда нас приведут нейросети.

Комментарии (109)


  1. ganqqwerty
    00.00.0000 00:00
    +108

    Да ничего хорошего. Сегодняшний интернет загажен копирайтерами. Завтрашний интернет будет кратно больше загажен нейросетями, которые учились на статьях копирайтеров.


    1. Breathe_the_pressure
      00.00.0000 00:00
      +16

      Да, хорошие статьи надо ещё поскать. Например захочешь найти какую нибудь специфическую информацию про встраиваемые системы, а там рассказывают всю историю со времен попа гороха, и все варианты от арифмометра до суперкомпьютера. Сразу видно рерайтер нарерайтил.


      1. ganqqwerty
        00.00.0000 00:00
        +1

        Про звукоизоляцию вообще кошмар, ни одной статьи от человека


        1. Eugene_Rymarev
          00.00.0000 00:00

          А у ChatGPT спрашивал? :D


      1. sn4385
        00.00.0000 00:00

        ????точно сказано! Хочется видеть ответ на вопрос сразу, а в итоге находишь его в последнем абзаце на двух строках, после нескольких страниц описания про жили-были ????


    1. bogolt
      00.00.0000 00:00
      +6

      Ну так и в браузере будет встроена нейросеть которая из входящего шума будет генерировать осмысленный контент, фильтруя мусор


      1. Groramar
        00.00.0000 00:00

        Зачем в браузере? В поисковике. Бинг - на грани релиза.


        1. Tarakanator
          00.00.0000 00:00

          для поисковика нужен интернет. А в браузере и офлайн работать сможет.


          1. iRumba
            00.00.0000 00:00

            Это как так офлайн? Ему тогда всю базу знаний у вас на компе хранить придется


            1. Tarakanator
              00.00.0000 00:00

              Это да, но хз насколько она сожмётся для нейросети. Чтобы ответить на вопрос: что показывали в аватаре, не обязательно хранить сам фильм.


              1. iRumba
                00.00.0000 00:00
                +1

                А чтобы ответить на такой вопрос по каждому существующему фильму, это уже надо хранить чуть больше информации. А чтобы ответить на вопросы по актерам - еще больше. Но мы ведь понимаем, что одними фильмами ограничиться не удастся :)

                Тут хоть как сжимай, информации будет целый вагон. И она будет регулярно пополняться.

                Более того, являясь владельцем такой базы знаний, вряд ли кто-то вот так просто отдал бы ее на растерзание любому желающему. Кто владеет информацией, тот владеет всем.


      1. maslyaev
        00.00.0000 00:00
        +3

        Будет из входящего шума генерировать конденсированный мусор.


    1. OneManStudio
      00.00.0000 00:00
      +2

      Смотрите дальше, работа подобных копирайтеров просто обесценится и потеряет актуальность в виду бессмысленности - новые поисковые движки вероятно будут не выдавать в выдаче подобные ресурсы.


      1. ganqqwerty
        00.00.0000 00:00
        +2

        А я вот не понимаю, сможет ли нейронка определять что контент сгенерирован нейронкой?


        1. imageman
          00.00.0000 00:00
          +1

          Коротко: пока - да.

          К примеру нейронки генерируют предложения примерно одинаковой длины (это самая примитивная эвристика).

          В целом со временем будет все сложнее отличить (особенно на популярные темы, особенно если ты не знаешь тему). Т.е. если ты досконально разбираешься в теме, то ты сможешь понять где лажа, но зачем знающему человеку читать такое (он и так в теме)?


        1. OneManStudio
          00.00.0000 00:00

          Определять будут так же люди, а нейронки учится. Опять же, спрос рождает предложение - кто заказчик этих "статей" и что он с них получает? Плату за рекламу. Кто будет в таком случае платить за рекламу которая показывается в генерируемом мусоре? Мало кто захочет за это платить. а значит продавцам рекламы надо различать ресурсы где их реклама будет показываться чтобы клиент не ушел. Сейчас люди платят за рекламу генерируемую ботами, просто потому что даже не задумываются о качестве покупаемой услуги. В случае нейронок возможно что то изменится, а может и нет.

          Как говорят - рыночек порешает как это будет.


        1. alextheprogrammer
          00.00.0000 00:00
          +1

          А я вот не понимаю, сможет ли нейронка определять что контент сгенерирован нейронкой? 

          Хмм.. Сможет ли программа определить что другая программа остановится или нет? Кажется Тьюринг уже ответил на этот вопрос..


    1. AllexIn
      00.00.0000 00:00
      +4

      Ничего не изменится. Все также будут ресурсы которым ты доверяешь и те, которым не доверяешь.
      Интернет уже очень давно огромная помойка с отдельными алмазиками. Ну стала помойка больше... Алмазики никуда не делись.


      1. user5000
        00.00.0000 00:00
        +3

        Будет сложнее отличить настоящие алмазы от поддельных.


        1. AllexIn
          00.00.0000 00:00

          Нет не будет. Также как сейчас. Есть условный хабр, в нем 99% технических статей годных. Совершенно не важно с помощью каких инструментов они написаны. Если качество начнет падать - значит хабр алмазиком быть перестанет.


          1. inemiten
            00.00.0000 00:00
            +3

            Мне кажется, вы пропустили слово "не" перед словом "годный".

            Но, в целом, мысль, на мой взгляд, верна. Искусственная или естественная нейросеть - не имеет значения. Важно качество подачи технического материала, его уникальность, применимость на практике.


    1. DenisUstinov
      00.00.0000 00:00

      Я, кстате, почему то, прихожу к таким же выводам!


    1. AlikhanAkhmetov
      00.00.0000 00:00

      Есть одна вещь которую не сможет сделать, эта вещь в ютубе называется 15 фактов Корана аль Фатиха. Никто не может повторить такое


      1. k05ta
        00.00.0000 00:00

        Хорошая попытка, но нет..


    1. ViseMoD
      00.00.0000 00:00

      Интернет давно уже теряет статус источника информации обо всём и всё быстрее становится похож на эффективный инструмент совершения покупок. Ну хорошо, не сам Интернет, а поисковики и контент, который они показывают в выдаче.


  1. saboteur_kiev
    00.00.0000 00:00
    +20

    "обзорные статьи" от нейросетей или новостные выпуски от редакции Хабра - не сильно отличаются, поэтому собственно это и возможно. Нормальные статьи класса хабрторт все равно редки и неросетям до них еще очень далеко.
    Поэтому я не очень понимаю удивления, если такие статьи будут попадаться.

    А вот если такие статьи будут получать по 50+ лайков, это уже будет вызывать напряжение. Но я не думаю что это вероятно.


    1. vilgeforce
      00.00.0000 00:00
      +8

      Зададим простой вопрос: для чего пишутся статьи? Например, статьи о насекомых, написанные представителями хостера и т.д. И зная ответ на этот вопрос совсем несложно представить генерированные статьи с полусотней лайков...


      1. saboteur_kiev
        00.00.0000 00:00

        Ну я вот писал статьи чтобы поделиться своим, чтобы получить людей, вовлеченных в мои интересы. Лайки приветствовались, но я совершенно не ставил их первоцелью.

        А представители хостеров пишут статьи вообще не ради лайков, а в качестве рекламы. Для этого им нужны не лайки а просмотры, чтобы название хостера примелькалось.


  1. aborouhin
    00.00.0000 00:00
    +20

    Ну так неинтересно. Вот если бы Вы выложили статью, она набрала бы сотню плюсов и две сотни комментариев - а потом признались бы, что это написала ChatGPT... :)


    1. CodeShaman Автор
      00.00.0000 00:00
      +15

      Признаться честно, эта мысль меня посетила самой первой. Опубликовать статью, которую написал chatGPT и посмотреть, что из этого выйдет. Но потом я подумал, что это в целом как-то не очень этично и как Хабр отнесется к такой "выходке". Ну, и что потом сделает за это моему аккаунту :)


    1. SuperTEHb
      00.00.0000 00:00
      +30

      Есть подозрение, что такие эксперименты уже несколько раз проводились.


      1. FollowerOfDarkness
        00.00.0000 00:00
        +4

        я так войну и мир прочитал


        1. PavelMSTU
          00.00.0000 00:00
          +1

          Вы нашли рынок. Генерирование дурацких сочинений для школы и для ВУЗ-а :)))


    1. Mingun
      00.00.0000 00:00
      +2

      Так может, и эта статья была написана нейросетью, вы же не знаете :) Давайте подождём денёк-два, может карты и вскроются…


    1. siberianlaika
      00.00.0000 00:00

      Для этого нужно научить chatGPT постить комментарии на хабр.


      1. aborouhin
        00.00.0000 00:00
        +3

        А неплохая идея... Я её попросил это сделать :)


    1. anonymous
      00.00.0000 00:00

      НЛО прилетело и опубликовало эту надпись здесь


      1. aborouhin
        00.00.0000 00:00
        +4

        Не вытягивает пока такие простыни генерировать на русском, останавливается посредине процесса :(

        Но начало многообещающее:

        Акт 1.

        (Главный герой и его жена сидят за обеденным столом)

        Жена: (заботливым голосом) Ты сегодня выглядишь уставшим, мой дорогой. Ты работаешь слишком много.

        Главный герой: (слегка улыбается) Ну это же моя работа, моя ответственность. Я должен зарабатывать нашу семейную жизнь.

        Жена: (печально) Да, но не забывай о себе и о своем здоровье.

        (Входит дочь)

        Дочь: (радостно) Папа! Как дела?

        Главный герой: (улыбается) Хорошо, конечно, моя малышка. А как у тебя дела?

        Дочь: (восторженно) У меня отлично! Я учусь в школе и хочу быть программистом, как папа!

        (Входит сын)

        Сын: (веселым голосом) Привет, папа!

        Главный герой: (радостно) Привет, сынок!

        (Свет гаснет, входит начальник)

        Начальник: (

        На самом драматическом моменте зависла :) На следующей попытке перешла на английский почему-то...


        1. Dgolubetd
          00.00.0000 00:00
          +4

          Что начальник делал у них дома? :O


          1. aborouhin
            00.00.0000 00:00
            +4

            Так вот и говорю же, интрига осталась нераскрытой :) А следующая попытка была уже совсем о другом.


            1. anonymous
              00.00.0000 00:00

              НЛО прилетело и опубликовало эту надпись здесь


          1. FarnhamTheDrunk
            00.00.0000 00:00

            Приходил к жене ГГ очевидно.
            Фильм "Ночные забавы" с Евстигнеевым и Гафтом.


        1. Mishootk
          00.00.0000 00:00
          +1

          Давайте проще эксперимент.
          Берем сценарий любого мылосериала крутимого по телеку, запрос "напиши продолжение по этому примеру". Сравниваем то что получилось с одной из серий этого же или аналогичного сериала.
          Мне кажется, еще чуть-чуть и по этому сценарию на дипфейках будет сгенерен видеоряд не сильно уступающий по качеству аналогичным существующим.
          Если попросить стиль плоских мультяшек (где в кадре по полминуты только рот шевелится да глаза моргают), то бесконечные мульти-пульти обеспечены.


          У кого навык есть, попробуйте. Даже любопытно стало.


        1. phaggi
          00.00.0000 00:00
          +3

          Просто скажите чатботу: "Продолжай."

          Он продолжит.


        1. ftpgg
          00.00.0000 00:00

          И на русском тоже можно.

          После того, как он закончил своё сообщение, нужно написать что-то вроде "продолжи своё сообщение", или просто "продолжи". Иногда бывают сбои, конечно, но сработать может


        1. ilia_bonn
          00.00.0000 00:00

          Мне в таких ситуациях помогает команда "Go on"


  1. dprotopopov
    00.00.0000 00:00
    +1

    Как хабр сможет отличить рукописные статьи от сгенерированных?

    Для проверки нужна нейросеть с большими ресурсами чем нейросеть которая генерит текст

    (количество состояний проверочного автомата должно быть больше количества состояний основного автомата)

    Как и в жизни - победит сильнейший


    1. Akr0n
      00.00.0000 00:00
      +1

      Авторы ChatGPT уже выкатили инструмент, позволяющий идентифицировать текст как творение их нейросети.


      1. MagisterAlexandr
        00.00.0000 00:00
        +1

        Поиском по всем логам?

        Когда аналог ChatGPT будет в open-source, такой метод не будет работать.


      1. gchebanov
        00.00.0000 00:00

        У меня иногда он жестко ошибается, но обычно идентифицирует правильно. Тут например затащил третий абзац.

        тулза
        Prediction based on 352 tokens
        Real 99.94%

        chat-gpt input

        In what situations in deep NN should you use which activation functions? For image classification task, mostly for residual convolutions net. Which candidates should be investigated first? Swish, relu, selu, gelu? may be weighted average?

        chat-gpt output

        The choice of activation function in deep neural networks is dependent on a variety of factors, including the type of problem you're trying to solve, the architecture of your network, and the desired properties of the activation function.

        For image classification tasks, ReLU is a popular choice due to its ability to introduce non-linearity into the model and its computational efficiency. ReLU is typically the default activation function used in residual convolutional networks, and it has been shown to work well in a variety of computer vision tasks.

        Swish, SELU, and GELU are alternative activation functions that have been proposed to address some of the limitations of ReLU. Swish is similar to ReLU, but it has a sigmoid function that can provide better gradients and improve the network's performance. SELU is a self-normalizing activation function that aims to maintain the mean and variance of the activations close to a fixed point, which can help to prevent vanishing and exploding gradients. GELU is a smoothed variant of the rectified linear unit (ReLU) that is based on the Gaussian error linear unit (GELU) activation function and has been shown to outperform ReLU in some cases.

        In terms of a weighted average, it is not typically used as an activation function. However, you could experiment with different weighted combinations of activation functions as part of your network architecture to see if it improves performance.

        It's worth noting that these are general guidelines and that the best activation function for your network may be different depending on your specific task and dataset. The best way to determine the optimal activation function for your network is to try out a few different options and see which one works best through experimentation and evaluation.


      1. vikarti
        00.00.0000 00:00
        +1

        А если перевести текст гуглтранслейтом?


    1. Revertis
      00.00.0000 00:00
      +3

      Для проверки нужна нейросеть с большими ресурсами чем нейросеть которая генерит текст

      Суммарные мощности нейросетей читателей Хабра и механизм кармы должны с этим справиться.


    1. WASD1
      00.00.0000 00:00

      Это если вы хотите избежать false negative на 100% и максимально ограничить число false positive (но теоретически они возможны).

      А если вы хотите поставить быстрый, но изредка ошибающийся фильтр возможны разные компромиссы.


      1. dprotopopov
        00.00.0000 00:00

        Если согласться на компромис , то более сильная система смоделирует механизм обхода.

        То есть так работают состязательные алгоритмы обучения пар нейросеток - одна учится предсказывать, другая опровергать...на каком-то этапе решают что хватит - и так сойдёт и выдают сгенерированный результат.


  1. n_kapyrin
    00.00.0000 00:00
    +1

    Надеюсь, часть пользователей перетекут в удобные ChatGPT-подобные поисковики.

    Те кто читает всё подряд (типа меня, когда делаешь дайджест) будут видеть разницу, остальные будут следить за приемлемым уровнем качества каналов, на которые подписаны.

    Земля продолжит вращаться :)


    1. saboteur_kiev
      00.00.0000 00:00
      +2

      Все еще проще.
      Просто просишь chatGPT сформировать для тебя персональную ленту из 10ти статей и сиди читай, не надо даже на Хабр заходить.


  1. tyomitch
    00.00.0000 00:00
    +6

    Как хабр сможет отличить рукописные статьи от сгенерированных?

    Если внешне они одинаковые, то кому какая разница?


    1. Revertis
      00.00.0000 00:00
      +7

      А в сгенерированных даже меньше ошибок. По крайней мере в тексте, не в коде :)


  1. zanzack
    00.00.0000 00:00
    +1

    Как хабр сможет отличить рукописные статьи от сгенерированных?

    Как сможет Хабр не знаю, но я пока что сразу вижу, кто писал статью - программист со своим корявым русским языком моя-твоя-понимай, скорее всего, это сказывается большая работа с английским техническим текстом - или же это не программист, пусть и не chatGPT, но журналист или кто там редактор (копирайтер), у кого русский язык на более высоком уровне.

    Короче, нужно в chatGPT русскую речь сделать более корявой и тогда точно никто никогда не отличит от реального человека.


    1. user5000
      00.00.0000 00:00
      +1

      Может не надо ?

      Мало того, что чуть ли не каждый второй комментарий написан на "корявом" русском языке, так теперь ещё и статьи будут "корявыми".


    1. JuryPol
      00.00.0000 00:00
      +1

      С удивлением наблюдаю, что ситуация один к одному напоминает ситуацию на шахматных сайтах. В последнее время ажиотаж на тему chatGPT привел к тому, что в 90% статей появляется комментарий типа "А не chatGPT эту статеечку сгенерировал?"...

      Я лет 15 зависал на самарском шахматном сайте, так там с первых дней вся аудитория поделилась на обычных игроков и на тех, кто каждый свой проигрыш объясняет использованием соперником шахматного движка. Создали специальную антипрогерскую комиссию, подают сотнями партии на анализ...

      И даже вывод комиссии о невиновности подозреваемого ровным счетом ничего не меняет. Мол, просто смог обмануть, делал ходы попеременно по вторым-третьим линиям и использовал сразу несколько движков.

      Печально...


      1. user5000
        00.00.0000 00:00
        +1

        Оно, конечно, печально, но, вы не поверите - некоторые игроки таки используют шахматные движки во время игры.


        1. JuryPol
          00.00.0000 00:00
          +1

          Ну почему «не поверю»… наоборот, уверен, что такие есть. Все дело в отношении к этому. Я нашел десять минут, партию в «пулю» или в «блиц» сыграл, встряхнул мозги. Если еще и интересные позиции случились, так получил эстетическое удовольствие. И совершенно мне неважно, прога играла или нет. А весь секрет в том, что мне совершенно наплевать на рейтинги, очки и прочую шелуху.

          Вот и в данном случае ровно то же самое. Информацию получил, если еще и полезная, так совсем хорошо. И мне совершенно все равно, кто мне это на блюдечке выдал, нейронка или «кожаный», прилежно скомпилировавший ту же самую разбросанную по Сети информацию. А если это все же человек, который описывает лично свой выстраданный практический подход к решению определенной проблемы, так это просто незапланированный праздник какой-то.


  1. Anvano
    00.00.0000 00:00
    +1

    Поначалу, пока такие сети учатся на контенте, который генерили живые люди - всё будет очень даже неплохо.

    Если вдруг дойдёт до того, что объем контента, сгенерированного (пусть даже потом пост обработанного) сетями будет возрастать и начнет превалировать над контентом, созданным вручную - обучаться сетям станет не на чем и качество контента сильно упадёт.


    1. d2d8
      00.00.0000 00:00

      В принципе это будет самообучение, так что далеко не факт, что качество упадет.


      1. dprotopopov
        00.00.0000 00:00
        +2

        Прирост количества информации по Шеннону будет 0, а энтропия может только возрастать


  1. Andris23
    00.00.0000 00:00

    Если рассматривать ИИ как инструмент в руках мастера - то это безусловно прорыв, станет больше полезных статей. Если кто то ловит хайп, просто генерируя тексты этим монстром - то модератор сайта скоро станет самой важной профессией, опаснее сапера)


  1. daniilgorbenko
    00.00.0000 00:00
    +5

    Ждем 2050 год, когда нейросети будут нанимать людей, чтобы люди для них "очеловечивали" текст и делали его более туп.. более простым...
    Ох уж это будущее...


    1. bioneko
      00.00.0000 00:00
      +2

      Было в Blindsight Питера Уоттса.


  1. vconst
    00.00.0000 00:00
    +10

    Как статья — никак. 5к знаков копирайтерастической банальности, годной максимум для лендинга, максимум

    А вот новостников заменить таким образом — уже можно


    1. Areso
      00.00.0000 00:00

      Ничего, в платной подписке поди подкрутят лимиты...


  1. leventov
    00.00.0000 00:00

    Зная, что такой контент, саммари темы/технологии можно получить on demand, по запросу к сети, да ещё и сразу связать сос своим контекстом: "набросай мне DDD сервис для бухгалтерии на питоне", всякий человеческий запрос к таким "пред-генеренным" статьям пропадет. Поэтому и не будут их писать.


  1. NetSvobodnyhNikov
    00.00.0000 00:00
    +4

    У меня, вот, нет уверенности, что ЭТУ статью написал НЕ chatGPT :)

    "chatGPT, напиши мне статью про то, как ты просишь chatGPT написать статью на хабр"


  1. mark_ablov
    00.00.0000 00:00
    +2

    Я уже наталкивался на хабре на статьи, которые очень подозрительно похожи на сгенерированные ChatGPT, вот эта, например - https://habr.com/ru/post/714146/


    1. eugenk
      00.00.0000 00:00
      +1

      Спасибо ! Пожалуй и правда соглашусь. Очень на то похоже.


  1. LevOrdabesov
    00.00.0000 00:00
    +4

    Ну вот пусть ChatGPT её и читает и комментирует.


  1. Dgolubetd
    00.00.0000 00:00
    +5

    Я вот думаю: в чем собственно разница кто написал статью, человек или ИИ? По сути, если статья качественная, то это - не важно. Проблема ChatGPT сейчас в том, что она может навешать на уши лапши - откровенно не достоверной информации. Отсюда у меня возникают следующие идеи:

    1. Если какой-то автор решил использовать ChatGPT - флаг ему в руки, но он обязан проверить достоверность всех указанных в статье фактов.

    2. Нужна система репорта статей с не верной информацией (не политика и тп вкусовщина, а что-то научное или практическое). Если автор попался на таком 2 раза - идет в бан.

    Или я упускаю другие аспекты какие-то?


    1. 314159abc
      00.00.0000 00:00

      Да, кажется это хорошая идея. Но тогда нужно разработать огромную систему модерации, заточеную конкретно под эту цель. Ну, не знаю на сколько овчинка выделки стоит. К тому же - как определить, вкусовщина или ошибка? Нужны какие-то особые технологии подтверждения и проверки, простой модерации статьи одним человеком при репорте думаю не хватит.


    1. vikarti
      00.00.0000 00:00
      +1

      Как быть с ситуациями вида (ну раз у нас статья про Python):


      • статья например про решение какой то задачи на питоне, но код не запускается на Python 3.11. Автор использовал сетку? Нет, код написан на Python 2
      • статья опять про питон и на этот раз не запускается на Python 2. только на этот раз дело в том, что код — кусок бота для EVE Online, а там Stackless Python с некоторыми отличиями + кое что импортнуто в глобальный неймспейс и при этом человеку который про EVE Online и то что там Python — будет совсем не очевидно это

      И что делать если это как то коснется даже не политики, а например истории или социологии?(есть ведь и такие стать на Хабре). Тоже наука но как ловить то? там же кроме общепринятого мнения бывают… точки зрения...


  1. YuriPanchul
    00.00.0000 00:00
    +13

    Фундаментальная проблема с любыми текстами от ChatGPT - иногда он гонит совершенно несусветную пургу, но очень уверенно и правдоподобно. Он хорошо хакает сигнальную систему хомо сапиенса, по которой человек "чувствует" говорит ли другой человек то что он знает или гонит.

    Например я спросил ChatGPT написать контроллер UFM (User Flash Memory) для Altera MAX II FPGA. ChatGPT предложил использовать $readmemh и подробно объясненил почему это надо. Проблема в том, что это не контроллер. Это догадка что может быть Quartus умеет автоматически синтезировать $readmemh в контроллер UFM, по аналогии с тем, как он умеет инициализировать BRAM память.

    Для UFM я никогда такое не видел, но прямо аж засомневался "а вдруг?" Также возможно ChatGPT "не понимает" разницу между синтезом и симуляцией.

    Через неделю я задал тот же вопрос и ChatGPT начал писать код чтения из блока SRAM, что тоже полная фигня, но очень солидным и уверенным тоном.


    1. MagisterAlexandr
      00.00.0000 00:00
      +6

      иногда он гонит совершенно несусветную пургу, но очень уверенно и правдоподобно

      Как и политики, журналисты, актёры, и прочие властители дум.

      хорошо хакает сигнальную систему хомо сапиенса, по которой человек "чувствует" говорит ли другой человек то что он знает или гонит

      Есть об этом видео.


    1. eugenk
      00.00.0000 00:00

      Это только потому, что во-первых у верилога есть синтезируемое подмножество, во-вторых этим очень мало кто занимается, а значит у сетки не было надлежащего обучения. Боюсь если бы Вы попросили написать что-то не совсем тривиальное на питоне иди джаваскрипте, в ответ тоже получили бы лажу, однако куда менее очевидную.


    1. sergree
      00.00.0000 00:00
      +2

      Соглашусь. Для меня прослеживается аналогия с "проблемами пальцев" у Midjourney.

      ChatGPT даёт довольно убедительные, на первый взгляд, ответы. Во многих случаях верные. Но иногда начинает нести откровенную отсебятину, которая имеет мало чего общего с реальным миром. Проверено на алгоритмах DSP и статистики как минимум. Думаю, таких сфер наберётся очень много, где придётся отделять зёрна от плевел. Получается уйма дезинформации, которую необходимо перепроверять.


  1. YuriPanchul
    00.00.0000 00:00
    +5

    Помимо того, что ChatGPT периодически гонит пургу, которую человек не в теме может не отличить от реальной информации, стилистически то, что он пишет - это говнотекст. То есть он как это говориться по английски "uninvolving", по русски это вроде называется "душнила". Если таким будет наполнен интернет, это будет трагично. Хотя и не так трагично, как будущие взрывы самолетов (а они произойдут), когда юные энтузиастичные к AI девелоперы, чтобы закрыть какую-нибудь дыру в проекте, будут вставлять в продакшн код куски, сгенеренные ChatGPT.


    1. acsent1
      00.00.0000 00:00
      +1

      Если таких будет много, то вполне возможно появятся ресурсы, которые более сильно следят за качеством публикуемых материалов


      1. Kenya-West
        00.00.0000 00:00
        +1

        ... и эту работу будет работать очередная нейросеть


    1. vconst
      00.00.0000 00:00
      +2

      стилистически то, что он пишет — это говнотекст
      А можно подумать, среднесерый копилефтер или графоман с какогонить самлиба или автортудея — пишут лучше?

      Всякие недорогие, быстрорастворимые рерайты на лендингах всех мастей, которые пишутся по расценкам пять копеек за знак и клепаются по хз сколько в сутки, чтобы хватило на сигареты — они лучше?

      Инет и так заполнен дешевыми душнилами от пера и клавиатуры, единственный рабочий инструмент которых — это словарь синонимов, чтобы манагер не очень офигевал от цифр антиплагиата


    1. urvanov
      00.00.0000 00:00
      +2

      Там сейчас сеошники и копирайтеры засуетятся и нагенеритуют этим ChatGPT ещё тысячи говносайтов с полной чушью в дополнение к автопереводам стековерфлоу и википедий.


    1. eugenk
      00.00.0000 00:00
      +2

      100% !!! Я вообще чем больше читаю последние статьи на любимом хабре, тем страшнее мне становится. Говорю это без всякой иронии. Вашу последнюю на хабе FPGA читал вообще с ужасом, наглядно представляя себе описываемые события... Мы (дети 50-60-х), воспитанные на фантастике, боялись сильного ИИ. Восстаний роботов, порабощения людей машинами и т.п. А бояться следовало совсем другого, на пороге чего мы похоже уже находимся... Нам с Вами с нашей специализацией считайте ещё сильно повезло. Очень мало кто с этим работает, и тому кто в теме, понять ИИ-шную лажу очень легко. Что в самое ближайшее время может произойти с теми же питонистами, представить себе страшно...


    1. heejew
      00.00.0000 00:00
      +1

      стилистически то, что он пишет - это говнотекст...Если таким будет наполнен интернет, это будет трагично

      Тут есть один нюанс - он же не сам такой душный от природы. Он научен этому на основе того, что писали люди. Так что вся проблема в людях


  1. vagon333
    00.00.0000 00:00

    Противостояние!
    Создаем FakeGPT для авто-фильтрации мусорные и поверхностные статьи!


  1. Ahuromazdie
    00.00.0000 00:00
    +2

    Почему SO не принимает ответы ChatGPT? С ними что-то не так? Они ошибочные? Или просто не хотят брать ответственность за последствия (возможные)?


    1. 1dNDN
      00.00.0000 00:00
      +4

      ChatGPT не подходит для генерации правильных ответов. Обычно он генерирует крайне правдоподобный, но неверный текст.

      Трудозатраты для создания ответов, которые выглядят правильными, но на самом деле ошибочны, гораздо ниже, чем трудозатраты для проверки этого ответа.

      Кроме того, в случае людей, плохие ответы часто легко отличить от хороших визуально, а ChatGPT излучает уверенность, не имея ни малейшего понятия о том, что говорит.

      Ну и, конечно же, это языковая модель, в отличие от того же Copilot


      1. Ahuromazdie
        00.00.0000 00:00

        Базы знаний тоже не имеют ни малейшего понятия о том что отвечают. Но их ответы вполне себе принимаются в качестве консультаций.

        Получается ChatGPT это просто болталка которая правильно строит фразы (в смысле натурального языка) опираясь на какие-то тексты. А если ей скармливать например только верифицированные медицинские тексты (учебники) она будет давать правильные ответы?


        1. 1dNDN
          00.00.0000 00:00
          +1

          Она будет выдавать правильно составленные медицинские тексты и неправильные ответы, потому что ее тренировали составлять правильные фразы, а не фразы с правильным фактами


    1. Groramar
      00.00.0000 00:00

      Интересно как будут ответы отличать?


      1. Ahuromazdie
        00.00.0000 00:00

        Вот тоже хороший вопрос.


  1. phenik
    00.00.0000 00:00

    которые мне доводилось читать на {абре за долгое время.
    Правильнее так писать
    которые мне доводилось читать на }{абре за долгое время.


  1. engine9
    00.00.0000 00:00
    +1

    Возможно на фоне этого шлака вызреет институт репутации авторов. А возможно, что их голоса утонут в инфошуме. Поглядим.


  1. raamid
    00.00.0000 00:00

    Печально то, что заходя в Интернет уже нельзя быть уверенным что общаешься с настоящими людьми.


  1. dimka11
    00.00.0000 00:00

    Главная проблема с ChatGPT, это то что приходится проверять на достоверность, все то, что она генерит, иногда быстрее самому загуглить и быть уверенным в результате. Возможно добавление "уверенности модели" частично решит эту проблему.


    1. vconst
      00.00.0000 00:00

      Надо сделать проверку на достоверность, с помощью ChatGPT!

      //картинка надо_идти_глубже.жпг


    1. 1dNDN
      00.00.0000 00:00
      +1

      Модель может быть хоть на 146% уверена, что это корректный выхлоп, но это не добавит точности фактам. Это языковая модель, она генерирует предложения, которые выглядят как правильные.


    1. Groramar
      00.00.0000 00:00

      По-разному. Недавно коллега гуглил 'код' для батника более часа. Удобоваримый ответ ГПТ отдал за 3-4 запроса. Минимальной допилки хватило что бы проблема была решена.


  1. ivanovdev
    00.00.0000 00:00
    +1

    Мне кажется OTUS атакует хабр с новой силой. И они выдавят всех авторов


  1. YashaDi
    00.00.0000 00:00

    Стандартная статья а-ля Вики. Прочитать можно, читать постоянно - нет.


  1. Apokalepsis
    00.00.0000 00:00

    OpenAI выпустил инструмент для проверки. Поэтому можно им проверять статью.


  1. Vhodnoylogin
    00.00.0000 00:00

    Как вы заставляете ГПТ писать такие длинные связные тексты?

    У меня он, как ни проси, выдавал лишь обрывочные данные - список тем, которые надо осветить, отдельные определения. Пытался я, правда, написать не доклад, а презентацию.

    Это не говоря уже о том, что количество символов в сообщении ограничено, а на просьбе продолжить, чат временами обрывает старый текст и начинает писать новый.


    1. CodeShaman Автор
      00.00.0000 00:00

      Обычно хватает фраз такого плана после очередного сгенерированного им блока: "продолжай", "продолжи с фразы ...последняя фраза в предыдущем блоке...", "продолжай и добавь примеры кода на Python" и так далее