Такие проекты как AOSP (Android open source project) или LLVM, содержат в себе примерно 2.5 и 11 миллионов строчек кода соответственно. Встроенный в IDE поиск или grep недостаточно эффективны при работе с такими большими кодовыми базами, не говоря уже о поиске в GitLab или GitHub.

Тем кто работают с Linux Kernel хорошо известен сервис bootlin.com. Именно этого – практически мгновенного структурированного поиска по сложной кодовой базе, не хватает многим открытым и «закрытым» – приватным проектам.

Именно для таких случаев многие крупные копании озаботились разработкой собственных инструментов для индексации и поиска, например Code Search от Google.
На мой взгляд лучшим решением из тех, что есть в открытом доступе является OpenGrok от Oracle.

Давайте рассмотрим как можно уменьшить порог вхождения в проекты со сложной кодовой базой, на простом примере. Для этого нам понадобится OpenGrok, Docker и vcstool.

OpenGrok

OpenGrok прекрасно работает в Docker-контейнерах, поэтому нам не придется долго возится с установкой:

docker run --rm -d \
    	--name opengrok \
    	-p 8080:8080/tcp \
	-e SYNC_PERIOD_MINUTES="10" \
	-v ~/opengrok-src/:/opengrok/src/ \
    	-v ~/opengrok-etc/:/opengrok/etc/ \
    	-v ~/opengrok-data/:/opengrok/data/ \
    	opengrok/docker:latest

Через несколько минут после запуска веб-интерфейс OpenGrok станет доступен на 8080 порту:

http://IP_ADDRESS:8080

Перед тем как начать работать с поиском, нужно будет предоставить OpenGrok исходники одного или нескольких проектов.
Vcstool – это «обертка» для нескольких SCM инструментов (git, mercurial, subversion, bazaar), которая облегчает работу с несколькими репозиториями.

Установка vcstool:

yum install python3-pip
sudo pip3 install -U vcstool

Сначала создадим простой манифест со списком необходимых репозиториев:

- git:
    local-name: taskflow
    uri: https://github.com/taskflow/taskflow.git
    version: master
- git:
    local-name: renode
    uri: https://github.com/renode/renode.git
    version: master
- git:
    local-name: cartographer
    uri: https://github.com/googlecartographer/cartographer.git
    version: master
- git:
    local-name: pigweed
    uri: https://github.com/google/pigweed.git
    version: main
- git:
    local-name: jetson-inference
    uri: https://github.com/dusty-nv/jetson-inference.git
    version: master
- git:
   local-name: jetson-containers
   uri: https://github.com/dusty-nv/jetson-containers.git
   version: master

Затем используем vcstool для синхронизации:

vcs-import --input repos.yml ~/opengrok-src/

Через несколько минут после перезапуска контейнера OpenGrok, проекты станут доступными в веб-интерфейсе.

docker stop opengrok && docker rm opengrok
docker run --rm -d \
    	--name opengrok \
    	-p 8080:8080/tcp \
	-e SYNC_PERIOD_MINUTES="10" \
	-v ~/opengrok-src/:/opengrok/src/ \
    	-v ~/opengrok-etc/:/opengrok/etc/ \
    	-v ~/opengrok-data/:/opengrok/data/ \
    	opengrok/docker:latest
OpenGrok
OpenGrok

Комментарии (2)


  1. csl
    06.05.2024 23:25

    Интересно, xAI's Grok назван так под влиянием продукта Оракла, или скорее Хайнлайна?

    https://en.wikipedia.org/wiki/Grok_(chatbot)#Background


    1. Rikimaru22 Автор
      06.05.2024 23:25
      +1

      Думаю, что ни то и не другое. От слова «to grok» – «understand (something) intuitively or by empathy».