Привет, это история о разработке самого удобного приложения для зубрежки английских слов инди-разработчиком. Еще одно?!
– Да, но с GenAI особенностями и алгоритмами!

Меня зовут Саша Ершов

я мобильный разработчик с 2012, в базе Android, Lead

Часть 1. Предыстория, теория и исследования

В ноябре прошлого года я пробую жить в Дубае и решаю подтянуть свой словарный запас. Тогда я начинаю перебирать приложения для изучения английских слов и остановился на Анки – это легендарный комбайн для зубрежки всего: слов, иероглифов, названий мышц и костей – всего того, где есть зубрежка. Ссылка на Вики.

Принципы Анки

Это приложение с карточками, где вам показывается слово, а вы, в свою очередь, пытаетесь вспомнить его перевод или определение. Если вспомнить не получается – нажимаете на кнопку, и перевод появляется.

Анки работает на интервальных повторениях и придуманной еще в XIX веке кривой забывания Эббингауза. Их суть повторять слово, которое вы пытаетесь запомнить, чуть ранее момента его забывания, при этом постепенно увеличивая интервалы между повторениями. Так слово закрепляется в долговременной памяти.

Первые программы с таким принципом
стали появляться в конце 80-х годов

Другими словами, вам показывается изучаемое слово, а вы пробуете вспомнить его перевод. Если вспомнить удается, то слово будет вновь показано для проверки уже через три дня, потом через восемь, двадцать два и так далее. Но если вы забыли – цепочка сбрасывается и начинает строиться заново с первого дня.

Слово проходит такую цепочку, постепенно увеличивая интервал для следующего повторения. При таких повторениях вы запоминаете слово на 100%. Правда, со временем удержать его в памяти становится сложнее. Но если вовремя напоминать слово, то постепенно оно запомнится навсегда. Если же повторение пропустить - слово снова забывается.

Алгоритм, заложенный в Анки, называется SuperMemo2. Интересно, что сейчас существует уже 18-ая версия этого алгоритма. В настоящее время идут споры Anki vs. SuperМemo об эффективности подходов в зубрежке. Я на стороне практического применения. Люди оказались не готовы тренировать слова чаще раза в день. Поэтому Анки и многие другие приложения продолжают использовать именно вторую, более старую, версию.

В любом случае постоянство важнее алгоритма.

Как учить понятно,
но что учить?
Слова, но какие?

Я решил поискать и пройти тесты на знание количества слов. Мой уровень на старте показывал 4500 слов. Далее, раз в месяц, я заново проходил эти тесты. Моя личная практика показала, что подобные тесты работают с погрешностью ±500-1000 слов.​

Слова важнее грамматики, ими можно говорить как тегами, и все-равно будет понятно: "Я ходить гулять девушка завтра", "Я документ терять" – звучит неправильно, но понятно, о чем речь.

Частоты слов и эффективность

Я нашел список слов распределенных по частоте использования англичанами в речи.

  • Начинать учить следует с ежедневных «he» и «she».

  • Далее перейти к словам посложнее «respect» и «ticket».

  • А потом еще более редким «refusal» и «pave» для эффективности.

Так на меньшее количество изученных слов будет больше понимания.

Я начал пролистывать этот список и зафиксировал в нем  то место, после которого у меня было уже много пробелов в знании английских слов. Именно с этого места я и стал учить слова в сторону более редких. Назовем это место начальной точкой.

График частоты употребления к словам
График частоты употребления к словам

Так вышло, что я не знал слово «vast», а в упомянутом выше списке оно было в первой 1000 слов.

И было достаточно много неизвестных мне, но частых слов до начальной точки. Я пробежался и тоже добавил их в обучение.

Обожаю экономить время: )

Позже я руками пролистал все 16.000 слов и исключил из изучения все уже известные мне слова, чтобы не учить их и не тратить на них время. Делал я это со скоростью 1000 слов в час.

Я нашел исследование на сайтах по тестам словарного запаса, в котором говорится, что вполне возможно найти такую начальную точку. На самом деле, довольно редко бывает, когда человек не знает популярные слова, но знает много редких.

У всех изучающих разные начальные точки: кто-то останавливается на «he», кто-то на «disturb». После этой точки изучающий знает уже мало слов. Они ему встречались редко, и он их не смог запомнить.


Процент изучающих английский язык и количество известных им слов по уровням A1-C2 примерно варьируется так:

  • Уровень A1, Начальный: ±10-20% и знает 300-500 слов

  • Уровень A2, Базовый: около ±20-30%, 600-1000 слов

  • Уровень B1, Средний: около ±30-40%, 1000-2750 слов

  • Уровень B2, Выше среднего: около ±15-25%, 2750-4500 слов
    (на этом уровне, кстати, изучающие часто начинают довольно свободно говорить на английском, смотреть фильмы без перевода и зачастую бросают изучение. И на С1+ переходит небольшой процент людей)

  • Уровень C1, Продвинутый: около ±5-10%, 5000-7000 слов

  • Уровень C2, Свободное владение: около ±1-5%, 8000+ слов

Интересно,
что люди прибавляют
около 2500 слов в год
в родном языке

Результат, 10.000 слов

Или +5500 новых слов. Столько стали показывать у меня тесты после 6 месяцев изучения. Я учил 30 новых слов в день, или +900 в месяц, по 30-60 минут в день после завтрака.

Я ощутил, что после 60 минут занятия слова поддаются изучению уже тяжело. Спустя 40 мин я мог чувствовать по своему недовольству, что уже «пересидел».

Это оказался очень эффективный способ, даже более эффективный, чем погружение и жизнь в англо-говорящей стране.

Проблема

Анки – это фантастический комбайн с миллионом функций. Её плюс – её проблема. Чтобы начать учить слова, нужно многое сделать и во многом разобраться: пройти тесты, найти и установить базу, отыскать эту начальную точку, включать и выключать слова. Плюс ко всему этому в Анки не понятный дизайн и странная статистика.

Да, существуют и другие приложения - я их отсмотрел и попользовался. Но все они казались сложными и тоже мало понятными, или были не лучше Анки. Quizlet -  хорошее приложение, но проблему, как у меня, не решало.

Marvel — чудо

Пока я учил слова, то делился своей статистикой и разными интересными встретившимися мне словами в запрещенном Инстаграм. И подписчики спрашивали, что это за приложение. Я рассказывал и давал ссылки.

Я скидывал людям ссылку, делился моей первоначальной частотной базой слов с озвучкой. Спрашивали действительно много. Но мне кажется, на этом многие и останавливались.

Основной скрин Анки. И еще, я впервые видел такую монетизацию: Анки стоит 2000₽ для Айфона, для Андроида – 0₽
Основной скрин Анки. И еще, я впервые видел такую монетизацию: Анки стоит 2000₽ для Айфона, для Андроида – 0₽

Я даже расстроился, когда понял, что нет простого приложения для зубрежки слов. Мне представлялось, что рынок в этой сфере мертв, что люди хотят DuoLinguo, Лингва-Лео, но они больше про грамматику. Есть похожие и тоже хорошие reWord, но просто мне ничего не зашло, только сложный и старый Анки. Как-то так и родилась идея приложения, простого, с простым входом, для зубрежки слов.


Часть 2. Приложение

И я подумал, нужно делать свое новое приложение, с вот этим всем. И сел, технологию взял обкатанный Flutter. Знаю, пишу, пробовал Kotlin Multiplatform. Но там пока много всего в будущем.

На работе мы перешли на Flutter – он хорошо показал себя. Я год сидел на нем, отлично его знаю и быстро пишу. И как говорят фотографы: самый лучший фотоаппарат, тот который у вас есть. Плюс Flutter позволил выпускать сразу на iOS и Android.

За два месяца и 30.000 строк кода мне удалось написать первую версию. Я сразу стал обкатывать ее на пользователях и себе.

Частотный список слов

Сначала я распотрошил проверенный и неплохой список слов с Анки и попробовал с ним. Но частоты оказались не совсем правильными.

Тогда я стал искать Гугловые частоты употребления слов в книгах NGram и просто кем-то собранные индексные базы для машинного обучения на 300k слов улучшил базу частотности слов. Плюс посмотрел частоты от Corpus of Contemporary American English (COCA). COCA, кстати, пишет, берите наши частоты и указывайте нас и пугают судом своим «пауком» который по ночам сканит интернет на свои списки.

Я миллион раз пересортировал базу слов, прокачал навыки Excel вместе с chatGPT и словил первые миграции БД для пользователей. Все пока хранится локально. Я просто не мог сказать пока еще не многочисленным пользователям: «Cорян, нужно заново все начать». У них уже шло обучение, и мне было бы жаль потерять их прогресс.

Это изменения по коду на гите, почти книга. Но 200k строк можно выкинуть, это 12 полных перезаливов базы данных из 14.000 строк.

Генерация изображений

В процессе пришла идея «нагенерить» картинок нейросетью. Я попробовал запустить Stable Diffusion на Mac. Для меня стало открытием, что кто угодно может запустить ее у себя.

Заработало, но на моем M1 один запрос генерировался по 2-4 минуты, не хватало оперативки и архитектуры.

А нужно было минимум 4000 слов и запросов – это достаточное языковое ядро для комфортных разговоров с другими людьми.

Я даже думал купить или арендовать игровой ПК на Винде с мощной видео-картой за 6000₽ в месяц.

Но помогли парни, бывшие коллеги, они подняли свою Stable Diffusion и уже дообучили её. Дали мне пару раз бесплатно API-доступ на пару дней к своему серверу. И я скриптами за пару ночей я сгенерил 4500 картинок.

Сначала я пробовал генерировать по слову, но есть проблема с абстрактными словами, типа «расстроенный» или «мудрость». Нейронка не цепляется за то, что нельзя изобразить. Поэтому я перешел на примеры и на  само слово в запросе.

Художественные стили и раскраска брались случайно из сета и подставлялись в запрос. Но позже все равно пришлось отбирать их руками со скоростью 1000 картинок в день.

Примеры генераций. Было 2 стадии и первую сразу видно :)

Иногда эти картинки получались очень странные. Сначала я думал, что для слова конь обязательно нужен конь. Но попробовав, я даже кайфанул с того что они такие.

Для запоминания нужна необычность,
так мозгу проще связывать
новые абстрактные слова.

Плюс в таком подходе задействовано больше каналов восприятия и визуальный и аудиальный.

Тестирование и продакт-девелопмент

Параллельно с разработкой я продолжал тестировать и рассказывал в запрещенном Инстаграм о продвижении разработки. Сейчас есть около десяти активных пользователей. Эти люди – моё золото и мои консультанты! Десять это не ноль и это означает, что идея рабочая. Они подсказывали, что неудобно и что не работает, а что выходит классно.

Например, было ошибкой сделать классическое обучение. Никто не хотел его читать, а просто пролистывал и, естественно, не понимал. Поэтому на коленке я собрал обучающий видос. Вместо того, чтобы начитать самому, я нашел голос и решил тоже озвучить его нейросетью. Он получился немного странным, но мне даже нравится.

Я залил его в Рилс, чтобы проверить досматриваемость и интересность. По статистике на вообще не "прогретых" людей он получился хорошим. Необходимо было сократить его до 45 секунд и перенести самое важное в первые 15 секунд.

Так почему еще одно приложение про английский?

Считается, что первые стартапы лучше делать не в «голубом» инновационном и бесконкурентном рынке: людям сложно объяснять новые идеи. Советуют идти в понятные «алые» и высококонкурентные рынки, типа психологии, эзотерики, похудения и английского. В этих сферах всегда есть спрос. И вы можете откусить свою долю от пирога. К тому же явных лидеров именно в изучении слов нет.

Я отсматривал почти все приложения в этой сфере и собирал с них интересные и рабочие идеи. Я вижу много приложений со сложным входом, где нужно разбираться. В такие моменты возникает микро-злость. Поэтому в своем я пробую выкинуть все тяжелое, не нужное и не работающее.

Например, я выкинул первоначальный тест. Он оказался не рабочим: люди не знали слов «chair» и «blue», а тест выдавал уровень B2. Они думали, что знают и самообманывались. Тест врал на начальной точке, но тем не менее неплохо показывал количество известных слов.

Планы

Сейчас в планах собрать 1000 активных бесплатных пользователей и обратную связь от них. И уже далее приходить к экспериментам с платными подписками. Хотя функционал готов.

Нужно заказать редизайн UI. Мой если показываешь про-дизайнерам раз***ывают. Но вкусовщина, сейчас UX главнее: )

И хочется сделать активности с друзьями. Обсуждения слов, соревнования и челенджи, как круги в часах Apple. Моя жена когда-то так увлеклась этим, что мы с ней в 23:30 ходили и закрывали активности, чтобы она смогла обыграть своих друзей. Это будет интересно, делится и смотреть статистику друзей.

Хочется сделать необычные примеры, генерировать их chatGPT. И перерисовать их.

Хочется понять статистику изучения сложных слов и давать лучшие способы запоминания на анализе этой статистики.

Инвестиции

  • Месяц назад получил предложение об инвестициях из Дубая на 10М₽ за 20% компании. Ребята классные. Но им нужен ретеншн и больше пользователей.

  • В июне я подался на грант на 4М₽, жду решения.

  • И сейчас готовлю кампанию на Бумстартере на 2М₽.

Выводы

  • Я пробовал несколько раз запускаться с другими проектами. И это мой первый проект в который я абсолютно верю и вижу, что может взлететь. Я сам пользуюсь и классно видеть как пользуются.

  • Да, могут закончиться деньги, но довести до ума и успеха хочется.

  • Есть сложности с РФ рекламой и отключенными платежами в наших сторах. Кстати последнее решилось, спасибо коллеге из Черногории.

  • Есть сложности с оплатами в РФ, возвратами пользователей в приложение, багами, переводами. Но все выглядит решаемым.

  • Главное что есть необычная идея и мне стало понятно как выглядит уникальность. Есть уверенность делаю нужное, есть первые пользователи. И понятно как в будущем искать такие идеи.

  • К первым негативным оценкам привыкаешь, это золото, потому что понятно что улучшать. Хоть внутри и злишься по началу.

  • Работа над стартапом это правда не легко. Но пока это самое интересное, что я делал.

Icicle

Изучи английские слова по нейро-картинкам

Скачивайте, учите, пробуйте
Бесплатно!

Попробовать приложение:

Приложение реализует все принципы эффективности из предыстории:

  • Работающие алгоритмы

  • Необычные GenAI-картинки

  • Эффективный частотный список словс третьими формами и фразовыми глаголами

  • Супер-простой Тиндер-подобный интерфейс

  • Определение уровня на входе, начальной точкии моментальные исключения известных слов

  • Уведомления, темы, звуки и озвучка

  • Мотивирующая статистика

  • Менеджер слов, поиск, фильтрация

  • и перерывы на цитаты Джобса и Рокки 4

PS

  • Полная история в виде подборки из сторис в Google Фото.

  • Есть вопросы? Про разработку, сторы, инвестиции или еще какие-нибудь пишите в запрещенный Инстаграм, подписывайтесь или Телегу.

  • Есть предложения о работе и сотрудничестве, можем обсудить: )

Спасибо за внимание
Лайк если понравилось :)

UPDATE: были сложности с установкой, поправлено :)​ iOS сейчас зайдет тоже

Комментарии (68)


  1. aborouhin
    11.08.2023 16:55
    +11

    Сейчас учу турецкий, использую reWord. По моемý впечатлению, проблема не в UX и не в недостаточно креативных картинках, и даже не в подборе лексики (ну тут мне, правда, проще, я почти с нуля) - а в отсутствии контекста, объясняющего выбор разных вариантов перевода.

    Половина беды, что у иностранных слов много значений - тут можно просто перечислить все основные. Но вот то, что родному слову часто соответствует несколько разных иностранных и в разных случаях правильно употреблять разные из них, - вот это через подобные карточки не выучить. Во-первых, карточки должны стать двусторонними (показывать не только иностранные слова с переводом на родной язык, но и родные с переводом на иностранный), во-вторых - к перечню значений должен быть добавлен контекст (из словарей лучше всего эту задачу решает Reverso, который показывает множество примеров применения из реальных текстов для каждого из вариантов перевода).

    P.S. Не понял, почему для установки приложения надо совершить танцы с бубном. Если задача набрать пользователей - так загрузив его в Play Store, очевидно, получится сделать это куда быстрее.

    P.P.S. Сам в тестировщики не пойду, пока у Вас только английский - у меня по тесту по Вашей ссылке 18 тысяч слов со 100% индексом честности, хватает для текущих потребностей :)


    1. raqeta Автор
      11.08.2023 16:55
      -1

      Мне кажется проблема не совсем в способе, а в мотивации. Я говорил со своим коллегой он работает в банке и он не it. Говорит, что у него b2, но он ему реально не так сильно нужен. Сейчас вообще английский нужен фактически только для живой речи. А слова можно учить и тетрадкой и бумажными карточками, важно учить :)

      Но картинки правда помогают, но тоже не всегда. Иногда мозг вообще не цепляется ни за что :)

      Про двусторонние переводы согласен, я сделал так. В одну сторону нужно вспоминать для собственной речи, в другую для понимания. И это вообще не одно и тоже.

      Изначально аккаунт был в РФ зоне для тестирования. Но и Гугл и Эпл запретили принимать платежи, скорее они просто не могут или не хотят проводить деньги. Хотя Гугл разрешили встраивать обходные способы оплаты, Киви там, Яндекс.Деньги. И я сейчас выхожу потестировать на более широкую аудиторию. Посмотреть на отзывы, баги и неудобства пользователям. Аккаунты за границей подготовлены. Но если плохо пойдет, придется восстанавливать оценки или перезаливать. Не рискнул, поэтому пока в тестовом режиме.

      18.000 прямо вау, это очень круто! :)


      1. aborouhin
        11.08.2023 16:55

        Ну насчёт "английский нужен только для живой речи" - это Вы, простите, как-то загнули. В любой профессиональной сфере ограничивать себя теми единицами процентов информации, которые переведены на русский, - ну так себе стратегия роста :) Ну и даже если в профессии не надо - так наверняка есть хобби, в котором тоже пригодится умение читать / слушать / общаться не через гугл-транслейт...

        А 18 тысяч слов - это не особо вау, так-то. Для чтения 99% информации в сети и онлайн/личного общения по бизнес-вопросам хватает, конечно. И это как раз расслабляет. Но что-то с более богатым языком (художественная литература или СМИ с претензией на интеллектуальность типа The New Yorker) - уже приходится иногда заглядывать в словарик. Но да, с этого уровня уже лексику лучше именно методом чтения со словариком расширять.


        1. raqeta Автор
          11.08.2023 16:55

          Я имел ввиду, что при огромном количестве контекстных словарей, онлайн словарей и улучшающихся технологии перевода нам уже не настолько необходимо знать язык. И вы правы про действительно классный литературный и публицистический уровень английского. Плюс английский за счет своей распространенности, впитывания слов со всех языков и простоты стал очень богат. Но переписываться я могу со всем этим и читать книги могу, и даже Ютуб уже Яндекс браузер синхронно переводит. А вот поболтать на лету за жизнь почти не возможно без знания.


          1. aborouhin
            11.08.2023 16:55

            Ну на безрыбье, конечно, и рак рыба... Так-то и устно общаться через гугл-транслейт можно, регулярно наблюдаю подобные спектакли и иногда даже вынужденно в них участвую (когда собеседник не знает английского, а необходимая лексика выходит за пределы моих знаний турецкого). Но возможность просто читать / смотреть / слушать и понимать без переводчиков - это всё-таки качественно другой уровень.

            Я сейчас плотно погружён в турецкоговорящую среду - и не только в устном общении, но и в чтении / письме очень хочу избавиться от необходимости использовать переводчики, потому что это дико напрягает и мешает.


      1. DaneSoul
        11.08.2023 16:55
        +2

        Сейчас вообще английский нужен фактически только для живой речи.

        Кому как. Английский учу уже более четверти века, регулярно читаю и слушаю материалы на нем, общаюсь в текстовых чатах. Но вот именно устно общался за все время ну может пару десятков раз, не считая уроков. И не потому что не могу, а потому что нет необходимости по большому счету.


    1. Anton-V-K
      11.08.2023 16:55
      +2

      поддержу предыдущего оратора :)

      мне кажется, словарный набор без контекста (вне предложений) может сформировать искажённое "чувство языка".

      Учу немецкий пока только через Duolingo (для общего развития, т.к. потребности в знании этого языка нет), и хотя в этом приложении не только словарный запас можно накопить, но и грамматику освоить, а также восприятие на слух, мои знания языка всё ещё весьма упрощённые и неполные (да и разговорный практиковать не с кем).

      Попытался представить, чем бы мне помог тренажёр слов... и признаться, сомневаюсь, что одного такого приложения было бы достаточно. Впрочем его можно использовать как один из инструментов, а в идеале хотелось бы изучать язык системно.


    1. DaneSoul
      11.08.2023 16:55

      Но вот то, что родному слову часто соответствует несколько разных
      иностранных и в разных случаях правильно употреблять разные из них, -
      вот это через подобные карточки не выучить.

      Карточки хорошо работают на изучение основных значений распространенных слов.
      Контекстные нюансы набираются в процессе вдумчивого чтения (а также прослушивания и просмотра) на изучаемом языке. Язык вещь комплексная, одним средством не обойтись.

      Про двусторонность работы карточек присоединяюсь - это очень важно. Более того, в современных тренажерах еще есть и распознавание на слух, упражнения на набор слова (правописание) - это очень важно для языков с неоднозначным соответствием письменной и устной формы, как в том же английском.


      1. dph
        11.08.2023 16:55
        +3

        Я бы еще обязательно добавил карточки на фразовые глаголы (их очень, очень часто забывают). И добавлял бы хотя бы по три значения, так как одного очень мало и только одно значение дает иллюзию "однозначности перевода".
        И, конечно, в идеале две озвучки - английская и американская. Да и перевода два, языки уже изрядно разошлись (


    1. vrnvorona
      11.08.2023 16:55
      +2

      Вы, по сути, описываете проблему конкретной колоды внутри приложения. Довольно сложно собрать экстенсивную колоду которая все покроет еще и контексты (которых всегда очень очень много).

      В Анки комьюнити принято "накапывать" себе карточки (mining) через активное использование языка. Смотришь такой себе фильм или видос или читаешь книжку и если что-то не понятно - разбираешься и кладешь в карточку с нужным контекстом (в виде предложения или мб даже клипа из видео).

      Так учат именно язык, а не слова, потому что как уже писали ниже, язык куда сложнее чем просто сумма значений слов - как минимум тем что эти слова надо выстраивать в предложения итд. Впрочем, мозг неплохо с этим справляется сам и основная сложность как раз в лексике.


  1. edogs
    11.08.2023 16:55
    +4

    Приятная статья про разработку, полная, обоснованная, интересная. Респект.
    Ниша действительно условно пустая, все приложения что видели - больше мешают, чем помогают.
    Имхо: тестирование словарной базы удобнее было бы делать выкатив текст на пару страниц и попросив в нем отменить незнакомые слова, в контексте это удобнее;
    неплохо бы иметь возможность заливать свою базу слов;
    раз уж речь про AI и вот это всё - как насчет "поиграть" интервалами между изучением слов более гибко - не по жестким формулам, а в зависимости от слова/смысла/человека;
    экстраполезно иметь не только перевод слова, но и определение его на изучаемом языке, есть достаточно сильные оттенки смысла (слова напрямую не переводятся почти никогда) и если учить прямой перевод, то от эффекта говорения "по русски на английском" не избавиться будет, даже если подтянуть грамматику. Плюс запоминается слово в таком случае намного сильнее, ибо создается мощный контекст.

    p.s.: Как-то крайне сомнительно что к 50 годам словарный запас 80 тысяч слов, при том что С2 это уже огого какой уровень, а на него 10 тысяч достаточно.


    1. raqeta Автор
      11.08.2023 16:55

      Спасибо.

      Это все в планах, про тестирование коэффициентов. Можно на больших данных попробовать вообще определить сложные слова и может выкидывать их. Ну не знаете вы 1 слово из 1000. Но за время потраченное на изучение и 200 повторов по 6 секунд вы выучите 10 других. Или работать с проблемным по-другому. Нейронкой подбирать примеры, тайминги повтора и картинки под человека.

      Но это все в планах и пока помечтать, сейчас важно создать первую ценность :)

      Про 80к к 50, есть такие же тесты на родной язык, мне 38, и у меня было 80к в русском. Но много людей показывали результаты и 120к.

      И С2 это уровни для изучающих, для нэтивов наверно другие тесты есть.


      1. edogs
        11.08.2023 16:55
        +2

        Про 80к к 50, есть такие же тесты на родной язык, мне 38, и у меня было 80к в русском. Но много людей показывали результаты и 120к.

        Разобрались, спасибо. Тут важный момент, что "все производные слова учитывались отдельно (например, «работа» и «работать», или «город» и «городской»"© . Оттуда же: "В русском литературном языке около 50 тысяч корней и десятки тысяч производных от них слов
        Имхо, это не совсем корректно, человек знающий "дом, машина, работа, компьютер, спутник" не должен оцениваться по словарному запасу так же, как человек знающий "работа, работать, зарабатывать, подрабатывать, работящий", хотя второму такой способ оценки несомненно приятнее:)


        1. vrnvorona
          11.08.2023 16:55

          Формы слов и их значения если они отличаются друг от друга по смыслу или нюансам все таки стоит учитывать как отдельные слова.


      1. aborouhin
        11.08.2023 16:55
        +4

        В русском у меня, оказывается, 111 тысяч слов... но там такую лексику проверяют (и ту, которую я не знал, и ту, которую по каким-то причинам - по большей части случайным, я знал), - что собственно к владению языком это уже имеет весьма опосредованное отношение. Скорее к начитанности (в части книжной и устаревшей лексики) и энциклопедичности знаний (в части узкоспециальной, которая к тому же, подозреваю, на всех языках звучит примерно одинаково, так что это тем более не тест на знание русского).


  1. kokonT
    11.08.2023 16:55
    +1

    Почему в вашем apk перевод английских слов на испанский?


    1. raqeta Автор
      11.08.2023 16:55

      Воу, вы наверное переключили ваш телефон на английски и по умолчанию стоит испанский, я не могу определить с какого вы языка. Я сейчас проверю версию по ссылке, там был фикс, который не давал вам пройти пока вы явно не укажете язык.

      А пока вы может поменять язык на русский через настройки.


      1. raqeta Автор
        11.08.2023 16:55

        Вы правы, вчера на ночь глядя выложил. И не проверил установку с нуля. Сейчас поправил, проверю и дам ссылку :)


    1. raqeta Автор
      11.08.2023 16:55

      Исправил, обновитесь тут :)


      1. selivanov_pavel
        11.08.2023 16:55

        Эта версия тоже при установке предлагает выбор из единственного языка - Espanol, и без выбора этого единственного вариант дальше пройти не даёт. Телефон - англоязычный, эспаньола там отродясь не было.

        https://habrastorage.org/webt/we/rm/dq/wermdqrzqgzfym1mc6rwzjadtag.jpeg

        Потом в настройках получается поменять на русский.


      1. selivanov_pavel
        11.08.2023 16:55

        Некоторые аббревиатуры показывает строчным буквами, например: lan. Я нажимаю "don't know", а потом оказывается, что имелось в виду LAN.


      1. selivanov_pavel
        11.08.2023 16:55
        +2

        Протестировав меня на уровень C2(многовато будет, ну ок), приложение предлагает учить слова and, I, you, to, of и так далее.


    1. Firsto
      11.08.2023 16:55

      У меня так же iOS версии.)


      1. raqeta Автор
        11.08.2023 16:55

        поправилось тоже


  1. kokonT
    11.08.2023 16:55
    +1


    1. raqeta Автор
      11.08.2023 16:55

      да-да про это, наверху справа есть настройки)


      1. kokonT
        11.08.2023 16:55
        +1

        В настройках стоит русский, а испанского на телефоне отродясь не было. Интерфейс андроида на телефоне русский. У вас баг в базе. Некоторые карточки русско-английские, а некоторые испано-английские


        1. raqeta Автор
          11.08.2023 16:55

          Да, была ошибка, поправил, обновитесь


  1. 1qwerty2023
    11.08.2023 16:55

    Для пользователей из числа малолетних детей (и великовозрастных лентяев) добавить бы платную опцию русской транскрипции (типа как у Драгункина), а то "лангуаге" хорошо запоминается, а ˈlæŋɡwɪdʒ уже проблемно.


    1. raqeta Автор
      11.08.2023 16:55

      С транскрипцией сейчас есть вопрос, она вообще нужна? Нужна была когда не было звуков. Сейчас мне кажется нет. Но идея классная.


      1. aborouhin
        11.08.2023 16:55
        +3

        Ну вот насчёт звуков, кстати - такие программы обычно где-нибудь в транспорте, на прогулке, в очереди и т.п. используешь, а не дома. И отнюдь не всем нравится при этом надевать наушники. Так что языковые приложения, которые безальтернативно предлагают что-то обязательно слушать, меня подбешивают.

        Посему, если бы я изучал английский с начального уровня, когда произношение ещё не очевидно, - наличие транскрипции было бы для меня важно. Но вот "русская транскрипция" - это, простите, извращение...


        1. raqeta Автор
          11.08.2023 16:55
          +1

          Все звуки можно отключать. И я поэтому пока не рискнул совсем ее убрать :)


      1. arhayka
        11.08.2023 16:55

        Так, как сейчас, точно нужна! Потому что у тебя например показывается слово imprint — а там ударение зависит от того, существительное это или глагол (и таких слов много).

        В транскрипции два варианта, а произносится только какой-то один :)

        Возможно, это стоит полечить как-то еще.


      1. leorikz
        11.08.2023 16:55

        нужна (мимо проходил, тест поставил)


      1. aleks-th
        11.08.2023 16:55
        +1

        Нужна конечно, без нее ущербный функционал будет.

        Постоянно даже в гугл переводчике именно ее и смотрю.


        1. raqeta Автор
          11.08.2023 16:55

          У меня жена тоже сказала, что смотрит ее. Не убираю.


  1. Berater
    11.08.2023 16:55

    Эх, как бы научиться забывать что-то навсегда.


  1. Survtur
    11.08.2023 16:55

    Ну, думаю, пройду тест на знание количества слов по ссылке в статье на хабре. Ничего же не может быть плохого. Потратил несколько минут. Даже название кнопки "получить результат" меня не смутило. Ну не может же человек на хабре дать ссылку на что-то нехорошее...

    Так вот на тебе, получи... Не результат, а кнопка регистрации.


    1. aborouhin
      11.08.2023 16:55
      +1

      Подсказываю - Вы там можете ввести любую совершенно левую почту для регистрации, результат покажет сразу :) Хотя такие фокусы жутко бесят, да.


    1. raqeta Автор
      11.08.2023 16:55

      :) я не специально, я сам на него когда-то нарвался и забыл. Тоже не люблю такое. Попробуйте эти:
      https://preply.com/en/learn/english/test-your-vocab
      https://myvocab.info/en-ru


      1. aborouhin
        11.08.2023 16:55

        Любопытно. Тест на Preply у меня показал 19,3 тыс. слов, что близко к 18 тыс. на тесте из статьи. Но количество реально незнакомых слов на втором этапе теста способно вогнать в депрессию - казалось бы, свободно общаешься, а сколько ещё не знаешь :( А вот тест на myvocab у меня упорно не хочет показывать результат, но что-то мне подсказывает, что он точно не для начальных уровней, там разве что начиная с Upper Imtermediate кто-то сможет пару знакомых слов узнать.


        1. raqeta Автор
          11.08.2023 16:55
          +1

          Я заменил в статье, чтобы не расстраивать больше. Но был этот – https://puzzle-english.com/vocabulary. Он за регистрацию


        1. Survtur
          11.08.2023 16:55
          +1

          У меня тоже https://myvocab.info/en-ru в конце не работает - какая-то ошибка в js


  1. Wesha
    11.08.2023 16:55

    Как запомнить что-нибудь навсегда?

    Огорошить жеж.

    P.S.

    Теперь и вы на всю жизнь запомнили, какой справа. Не благодарите.


    1. aborouhin
      11.08.2023 16:55
      +1

      В Вашем конкретном случае из той байки это избыточно (ассоциации "правый - правильный - зелёный" и "левый - неправильный - красный" и так самоочевидны), но вообще да, яркие, иногда абсурдные, образы очень помогают запоминанию. Использую такой способ всегда, когда только получается.

      Проблема в том, что это работает в единичных случаях, а когда надо быстро запомнить сотни слов - на всех них таких ассоциаций не придумаешь, а если и придумаешь - то тут уже они тоже начнут забываться и перестают работать.


  1. dyadyaSerezha
    11.08.2023 16:55

    Автору - в вашем приложении "In the list you should known Three words". Почему known и почему Three с большой буквы?


    1. raqeta Автор
      11.08.2023 16:55

      Я подумал так лучше читается, но раз вас зацепило, я подумаю. Спасибо.


      1. aborouhin
        11.08.2023 16:55
        +1

        Там проблема не в том, что кого-то зацепило, а в том, что это просто неграмотно :) Или "should know", или "should have known", в зависимости от контекста.


      1. dyadyaSerezha
        11.08.2023 16:55

        Known - банально неверно в данном случае. Ну и каждую строчку с большой буквы начинают, когда стихи пишут. У вас стихи?


  1. Diordna
    11.08.2023 16:55

    Мои 5 коп, за неделю зазубриваю всего 10-15 слов не больше, так каждую неделю Ну за год 500-600 слов получается. плюс голосом будут какие-то однокоренные слова которые вы сможете угадать встретившись с ними

    И ещё важное наблюдение без практики забывается любые навыки вопрос через какой промежуток времени.

    Понимаю что это не так круто как в предложенном здесь способе, просто поделился своим опытом

    Удачи в изучении иностранных языков


    1. raqeta Автор
      11.08.2023 16:55

      Вы правы, практика важна. И слова какие-то забываются без использования. Я проводил у себя в блоге опрос кто сколько слов знает и результаты у некоторых людей были очень впечатляющими. Я спросил у них, откуда столько знаете? – Специально учили, кто как, кто карточками, кто тетрадочкой, кто приложениями, но учили.


  1. LedIndicator
    11.08.2023 16:55
    +1

    Как запомнить что-нибудь навсегда?

    В девяностых (то есть лет так примерно около тридцати назад), ребёнком посмотрел передачу с каким-то товарищем обучающим запоминанию. Помню, он показывал фокус: ему показывали предметы, а он их запоминал и перечислял в обратном порядке словами. Предметов было много. В конце сказал телефон своей конторы, где они, значит, развивают память всем желающим, 194-66-04.


    Сказал, что сейчас скажет как его запомнить и вы, уважаемые телезрители, его уже никогда не забудете.
    Не соврал, блин. :(


    1. GospodinKolhoznik
      11.08.2023 16:55
      +1

      Мастер Дент сеть стоматологий, номер наш един 274-10-01


  1. Slav2
    11.08.2023 16:55

    Я делал приложение на автохоткее (смартфонов еще не было), которое по типу викторины показывало слово и несколько кнопок с вариантами перевода. Вам не нужно ничего ни запоминать, ни вспоминать, ни даже думать запомнили вы слово или нет, просто кликать варианты чем быстрее тем лучше. Правильный вариант всегда отобразится в конце. Вы его увидите и прослушаете и, не стараясь запомнить, переходите к следующему вопросу. Слова уходили в архив, когда человек отвечал правильно больше определенного количества раз. Счетчик правильны ответов снижался если слово было переведено не правильно. Отличная идея с увеличением периодов показа слова при увеличении счетчика правильных ответов, до этого не дошел. Прогу можно скачать тут кому интересно.

    По вашему приложению

    Вытаскивать правильный перевод из памяти проще, когда он есть среди вариантов ответов. Ассоциация с картинкой тоже помогает вытаскивать перевод из памяти, но ассоциации к каждому слову это перебор. Какие то слова быстро запоминаются и без картинки. Может сложиться более сильная ассоциация не между словом и переводом, а между картинкой и переводом. Придется потом вспоминать какая там была картинка из тысяч картинок чтобы что-то перевести. Если человек неправильно отвечает, тогда уже запускать ассоциацию.


    1. vrnvorona
      11.08.2023 16:55

      Проблема в том что тогда может быть сложно вспомнить без подсказок. Вспомнить имея варианты проще, но цель-то запомнить так чтобы железно (с погрешностью).


      1. Slav2
        11.08.2023 16:55

        Допустим мы читаем книгу. Мы можем искать перевод слов в словарике. Это существенно дольше. Мы будем стараться каждое слово выписывать и таскать с собой на перфокарте, заучивать потом в автобусе чтобы реже заглядывать в словарь. Читать книгу при этом будем медленнее, хорошо бы главу перевести за несколько дней. Или у нас уже есть выписанные неизвестные слова с переводом на листе. Мы просто читаем книги одну за другой не стараясь ничего запоминать. В каком случае мы будем быстрее запоминать слова?


        1. vrnvorona
          11.08.2023 16:55

          Ревью карточек с свободным ответом, а не multiple choice, не является вариантом "с заучивать". Так же не обязательно все непонятное закидывать в карточки для дальнейшего заучивания. Плюс, карточки учат по 5-10 штук в день максимум независимо от количества их майнинга.

          Поэтому аналогия и сравнение некорректное как по мне. И тот и тот способ быстрый, но у multiple choice есть проблема что мозг не так хорошо практикуется в воспроизведении памяти (recall) т.к. среди ответов он есть - нужно просто вспомнить какой. Это проще, но и не так полезно. Ну и разумеется надо рандомизировать позицию чтобы не заучить просто на каком месте правильный ответ.

          Обычный подход это при ревью карточки думать о смысле, если при открытии карточки смысл который вспомнил мозг совпадает достаточно (не обязательно идеально) то считать как успешно.


  1. kemsky
    11.08.2023 16:55
    +1

    Было интересно пройти тесты. Что касается русского, то он явно смещен в заимствования и устаревшие слова, то есть измеряет скорее груз, а не запас (вероятность услышать некоторые слова в течение всей жизни практически равна нулю). Ангийский же получается смещен в сторону тех, кто учил недавно или учит по словарю. Оба теста недостаточно проверяют действительно ли испытуемый знает значение, просто кликая некст я выбил 22 тысячи по английскому.


  1. Zara6502
    11.08.2023 16:55
    +1

    Скажу сразу, я не против методик и не оспариваю давно сделанных научных доказательств того или иного режима работы мозга, но есть нюансы связанные конкретно со мной.

    1) Мне бесполезно учить какие-то там карточки, мне нужно только уезжать в страну с носителями языка и каждый день много говорить на этом языке.

    2) Я учил английский разными методиками и максимум который достигнут - это слова из UI на компьютере, которые я могу видеть каждый день.

    3) Умение читать и знание слов абсолютно никак не помогает в построении предложений и общении, а тем более в произношении, потому что сказанное "я есть быть еда" может значить как "я покушал", "я хочу кушать", "я кушаю" и т.п. И порой смысл может быть противоположным.

    4) Супруга учила слова французские чтобы читать рецепты без переводчика, набор 100-150 слов, выучила за месяц, но у меня такой же набор слов из ИТ тематики, это абсолютно никак и ничем не поможет в реальной жизни.

    5) Самое сложное в любом языке - это правила, в русском я решил эту проблему в 14 лет начав читать книги в бесконечном количестве. То есть я знал много слов и выучил их написание, а в английском у меня другая проблема, я не знаю слова, но знаю как они пишутся, поэтому например англоязычный вариант игры "Поле чудес" - Wheel Of Fortune я быстро выигрывал не читая вопроса, опираясь только на начертание слов. А запоминается это примерно в таком виде, слово "brought", я вообще без понятия как его читать, а когда пишу, я всегда знаю что это "броугхт".

    6) Если какое-то слово не попадалось мне в текстах больше пары недель, то я его забываю навсегда. Я не люблю читать совсем, поэтому за последние 25 лет не прочитал ни одной книги, а в интернете пользуюсь переводами страниц - это проще, быстрее. Иногда читаю на английском но обычно для понимания текста нужно 10-15% слов перевести.

    7) Брат уехав в англоговорящую страну поднял свой уровень английского за пол года раз в 10 по сравнению с с разными уроками по скайпу и самообучением, так что мне кажется принципы у всех одинаковые, разница только в том насколько хороша память.

    Поэтому если я попаду в англоговорящую страну то я прикинусь немым и буду писать на бумажке "Good day, sir. My car damaged in accident. Please call a police and give me water. Thanks.", больше этого я за 35 лет ничего не смогу вспомнить.


    1. vrnvorona
      11.08.2023 16:55
      +1

      Ответ на вашу "проблему" кроется в самом комментарии - учить без активного использования бесполезно, мозг запоминает актуальное и забывает бесполезное. Нет никакого смысла учить текст если не читать.

      Правила это тоже спорно, носители языка чаще их знают хуже чем учащие, т.к. правила это в первую очередь модель описывающая как говорят люди, а не наоборот. И учить язык и говорить можно без правил, мозг отлично находит и запоминает паттерны.

      Карточки нужны в первую очередь чтобы постоянно учить и поддерживать лексику, которая поможет уже на этапе использования языка (чтение или слушание) т.к. мозг будет иметь куда больше возможностей для "вывода" смысла из прочитанного/услышанного. Никакой магии в карточках нет


      1. Zara6502
        11.08.2023 16:55

        постоянно учить и поддерживать лексику

        если ваша жизнь ограничена этим языком, то я наверное даже пойму о чем вы, но если язык даже не на втором месте, то где брать время чтобы постоянно читать эти карточки? (я прочитал в вашей статье про один час в день за завтраком, но это несколько не то, о чем мы говорим, см. ниже)

        Собственно о чем речь - я читаю название статьи, читаю статью и не нахожу пересечений между первым и вторым. Это как урок по рисованию совы.

        Отсюда и вопросы. Либо вы предлагаете что-то универсальное, либо описываете рамки применимости.

        Далее

        Я учил 30 новых слов в день, или +900 в месяц, по 30-60 минут в день после завтрака.

        Вы читали или учили? Это как шутка с Камазом - я поднимал камаз, но.... не поднял.

        Я тоже могу написать что я учил 8000 слов в секунду, но... не выучил.

        Если же вы серьезно 30 новых слов в день учите, запоминаете их перевод, склонение, применение в разных частях разных предложений - то есть вы выучили и знаете это слово, да еще и 30 штук в день и так каждый день (да еще и за одну-две минуты на слово - то у вас суперсила. Но не нужно вашу суперсилу проецировать на всех и тем более свои способности выдавать за путь. У большинства это не будет работать.

        Так вы всё же напишете - как запомнить что-нибудь навсегда? Или это так и останется кликбейтом?

        PS: пример про сову здесь не зря, потому что у вас рецепт "как запомнить это навсегда" сводится - берёте и запоминаете.


        1. vrnvorona
          11.08.2023 16:55

          Для начала, я не автор статьи поэтому про количество слов - не ко мне. Лично я согласен что 30 слов в день это ту мач, обычно учат 5-10, потому что иначе ревью карточек не будет влезать в 1 час через месяц-другой.

          то где брать время чтобы постоянно читать эти карточки?

          Карточки это лишь инструмент для лексики, выделять на них больше 30-60 минут в день не стоит. Мои комментарии про использование языка - не про частоту или количество карточек, а про реальный контент вроде книг или фильмов итд. Если нет времени на использование языка, то зачем вообще учить язык?


  1. DikSoft
    11.08.2023 16:55
    +2

    Спасибо, поставил, буду честно тестировать не меньше месяца. На анки в своё время забил, ибо Windows версия была кривущая и неудобная.

    Но есть подозрение в переборе с околокомпьютерной терминологией в стартовых тестах. Мне явно показало завышенный результат. Это может быть связано с тем, что частотность считалась на всей базе текстов Интернета, где технические тексты в поиске втречаются чаще?


  1. ivansmith
    11.08.2023 16:55
    +1

    Только запустил, первая карточка.

    Вы серьезно предлагаете так учить английский?


    1. Wesha
      11.08.2023 16:55

      Это фиаско, братан! (с)


    1. Slav2
      11.08.2023 16:55

      GPT 3.5 переводит как авиалинии, а translate.google.com и deepl.com как дыхательные пути. Картинки, кстати, лучше генерировать используя в запросе оригинальные слова на английском. Интересно какой был промпт, чтобы получить такую картинку.


      1. Wesha
        11.08.2023 16:55

        ВНЕЗАПНО, правильно и то и другое — в зависимости от контекста.


        1. Slav2
          11.08.2023 16:55

          И вентиляционный штрек будет правильно, но большие языковые модели используют вероятности нахождения в тексте слов с определенным значением. Когда вы грузите список из 1000 наиболее употребимых слов, то и перевод должен быть такой, благодаря которому слово и попало в список