brmson/wikipedia-extractor - Gitstar Ranking

brmson

Fetched on 2026/03/02 12:30

Extracts and cleans text from Wikipedia database dump and stores output in a number of files of similar size in a given directory. This is a mirror of the script by Giuseppe Attardi. - View it on GitHub

http://medialab.di.unipi.it/wiki/Wikipedia_Extractor

Star

Rank

4265938

brmson

brmson / wikipedia-extractor