Este repositório tem como objetivo aplicar o scraping no website busca.tjsc.jus.br/jurisprudencia. O código foi desenvolvido em PHP com Hyperf e é capaz de extrair informações relevantes, como número do processo, relator, origem, órgão julgador, entre outros, e persisti-las no banco de dados PostgreSQL.
- Execute a imagem Docker através do seguinte comando:
docker-compose up -d
- Dentro do container Hyperf, execute os comandos para instalar o componente e atualizar as migrations:
php bin/hyperf.php migrate:install
php bin/hyperf.php migrate:fresh
- Realize a geração das jurisprudências utilizando o comando:
php bin/hyperf.php scrapy:scjus numeroDePaginas
Após a execução bem-sucedida desses passos, as informações extraídas estarão disponíveis no banco de dados PostgreSQL.
Em caso de erros ou bloqueios durante o processo, os logs estarão disponíveis em runtime/logs/
para análise posterior.