Сразу скажу, это не кликбейт, но до конца эту идею я финансового(как и скорее всего вы) довести не смог.
Для начала давайте рассмотрим Copilot'а со всех сторон!
Его разрабатывали совместно Github(от них датасет) и OpenAI(от них Codex)
Его резко закрыли в России из-за санкций
Он продолжает код пытаясь понять вашу мысль
Согласитесь, очень интересно!
Теперь посмотрим что у нас есть, и как можно меньше потратить денег...
Датасет кода достать не проблематично, он уже давно есть в отрытом доступе.
Codex дорого, так что я решил найти Open Source конкурента, и что меня удивило, я нашёл!
CodeGen is an open-source model for program synthesis. Trained on TPU-v4. Competitive with OpenAI Codex.
-------
CodeGen - это модель с открытым исходным кодом для синтеза программ. Обучался на TPU-v4. Конкурирует с OpenAI Codex.
Разработчики некого CodeGen заявляют что их продукт конкурирует с Codex, но верить на слово - одно, а проверить на деле - другое. Так что уже через 5 минут я собрал Google Colab, и начал проверять.
Ссылка на Colab
Кстати интересный момент заметил, когда изучал документацию:
Есть несколько вариаций натренированных моделей, которые делятся по размеру и обученных данных, что очень меня обрадовало. Почему? А к этому ещё вернёмся!
Для тестов я решил взять среднюю по размеру модель со всеми опциями, весит эта модель в итоге почти 6GB:
И тут возникает(как минимум у меня) несколько вопросов:
Копилот же генерирует ответ за секунду, будет ли CodeGen так же хорош?
А какие языки поддерживает CodeGen?
С первым вопрос всё не очень однозначно, я пишу как никак с минимальными знаниями в подобной сфере, но машина Colab с 16GB видеопамяти генерирует на модели Salesforce/codegen-2B-mono
ответ с длиной до 24х символов практически за секунду.
А ответ на второе я нашёл на сайте модели, C, C++, Go, Java, JavaScript, и Python.
Интересный факт
кстати самая мощная модель весит 32GB
Продолжаем, теперь пора и потестить что мы имеем:
Из картинки выше можно сделать несколько выводов, средняя модель уже легко понимает что от неё хотят, но генерирует ответ за 1.44 секунды...
Да, печально, в этом и загвоздка, по финансам такой проект содержать дорого, ибо цены на сервер с видеокартами начинаются с 11 тысяч, и то такие нам не пойдут что бы запилить полноценный Copilot, но вот для себя поднять на своём ПК или Colab можно легко.
На самом деле большого продолжения проекту я дать не могу, но я показал что всё можно заменить альтернативами если приложить усилия, удачи!
Комментарии (10)
Hardcoin
00.00.0000 00:00+12Вы не повторили копилот, вы запустили готовую модель. Их для того и делают, что бы другие могли их запускать, но это как установить LAMP и говорить, как вы без денег и знаний повторили apache.
vladimirsky
00.00.0000 00:00+1Мелкомягкие в своем духе. Взяли для обучения код, который писали тысячи программистов, а теперь бабки сшибают.
Раз сервера с видюхами дорогие, по-моему, не плохо было бы для AI использовать подход из open source. Для обучения подобных сеток программисты сообщества могут предоставлять рабочее время своего компа. Предоставил пару часов - получай для использования обученную сеть.
Так можно и обскакать их хваленый copilot.
Hungryee
00.00.0000 00:00+3Почему у этого столько плюсов? Бесполезный материал с желтушным заголовком, который не имеет ничего общего с реальным наполнением
DustCn
Проблема всех подобных штук - пока сформулируешь и правильно артикулируешь то что ты хочешь, пройдет время. И частенько бывает быстрее самому написать, а не объяснять че ж ты хочешь и почему пуговицы должны быть перламутровыми.
IvanTheCrazy
Смотря с какой стороны заглянуть. Вчера нужен был баш скрипт, я в башне не силен. Запросил у чатгпт. Через 4 или 5 итераций получил что хотел - исправлены все ошибки, добавлена совместимость с маком. Сейчас уже более суток скрипт в Дженкинсе, работает.
Потом сегодня нужно было достаточно сложную строку распарить - для этого нужен был регекс. В чатгпт вкинул строку - он сразу сказал, откуда такое, где и зачем используется. В две итерации сделал нужный регекс.
Для большого количества применений норм думаю будет.