Name		Name	Last commit message	Last commit date
Latest commit History 75 Commits
Britbase		Britbase
Bundesliga		Bundesliga
ChessNostalgia.com		ChessNostalgia.com
ChessOk.com		ChessOk.com
Chessopolis.com		Chessopolis.com
Code		Code
Convekta		Convekta
Corus		Corus
Filtered		Filtered
Kingbase		Kingbase
Npollock		Npollock
PgnDownloads		PgnDownloads
PgnMentor		PgnMentor
PolyGlot		PolyGlot
RebelSite		RebelSite
Twic		Twic
WorldChampionships		WorldChampionships
.gitconfig		.gitconfig
.gitignore		.gitignore
README.md		README.md
all-2400.sh		all-2400.sh
all-2600.sh		all-2600.sh
mega2400_part_01.pgn		mega2400_part_01.pgn
mega2400_part_02.pgn		mega2400_part_02.pgn
mega2400_part_03.pgn		mega2400_part_03.pgn
mega2400_part_04.pgn		mega2400_part_04.pgn
mega2400_part_05.pgn		mega2400_part_05.pgn
mega2400_part_06.pgn		mega2400_part_06.pgn
mega2400_part_07.pgn		mega2400_part_07.pgn
mega2400_part_08.pgn		mega2400_part_08.pgn
mega2400_part_09.pgn		mega2400_part_09.pgn
mega2400_part_10.pgn		mega2400_part_10.pgn
mega2400_part_11.pgn		mega2400_part_11.pgn
mega2400_part_12.pgn		mega2400_part_12.pgn
mega2400_part_13.pgn		mega2400_part_13.pgn
mega2400_part_14.pgn		mega2400_part_14.pgn
mega2400_part_15.pgn		mega2400_part_15.pgn
mega2400_part_16.pgn		mega2400_part_16.pgn
mega2400_part_17.pgn		mega2400_part_17.pgn
mega2400_part_18.pgn		mega2400_part_18.pgn
mega2400_part_19.pgn		mega2400_part_19.pgn
mega2400_part_20.pgn		mega2400_part_20.pgn
mega2400_part_21.pgn		mega2400_part_21.pgn
mega2400_part_22.pgn		mega2400_part_22.pgn
mega2400_part_23.pgn		mega2400_part_23.pgn
mega2400_part_24.pgn		mega2400_part_24.pgn
mega2400_part_25.pgn		mega2400_part_25.pgn
mega2400_part_26.pgn		mega2400_part_26.pgn
mega2400_part_27.pgn		mega2400_part_27.pgn
mega2400_part_28.pgn		mega2400_part_28.pgn
mega2400_part_29.pgn		mega2400_part_29.pgn
mega2400_part_30.pgn		mega2400_part_30.pgn
mega2400_part_31.pgn		mega2400_part_31.pgn
mega2400_part_32.pgn		mega2400_part_32.pgn
mega2400_part_33.pgn		mega2400_part_33.pgn
mega2400_part_34.pgn		mega2400_part_34.pgn
mega2400_part_35.pgn		mega2400_part_35.pgn
mega2400_part_36.pgn		mega2400_part_36.pgn
mega2400_part_37.pgn		mega2400_part_37.pgn
mega2400_part_38.pgn		mega2400_part_38.pgn
mega2400_part_39.pgn		mega2400_part_39.pgn
mega2400_part_40.pgn		mega2400_part_40.pgn
mega2400_part_41.pgn		mega2400_part_41.pgn
mega2400_part_42.pgn		mega2400_part_42.pgn
mega2400_part_43.pgn		mega2400_part_43.pgn
mega2400_part_44.pgn		mega2400_part_44.pgn
mega2400_part_45.pgn		mega2400_part_45.pgn
mega2400_part_46.pgn		mega2400_part_46.pgn
mega2400_part_47.pgn		mega2400_part_47.pgn
mega2400_part_48.pgn		mega2400_part_48.pgn
mega2400_part_49.pgn		mega2400_part_49.pgn
mega2400_part_50.pgn		mega2400_part_50.pgn
mega2400_part_51.pgn		mega2400_part_51.pgn
mega2400_part_52.pgn		mega2400_part_52.pgn
mega2400_part_53.pgn		mega2400_part_53.pgn
mega2400_part_54.pgn		mega2400_part_54.pgn
mega2400_part_55.pgn		mega2400_part_55.pgn
mega2400_part_56.pgn		mega2400_part_56.pgn
mega2400_part_57.pgn		mega2400_part_57.pgn
mega2400_part_58.pgn		mega2400_part_58.pgn
mega2400_part_59.pgn		mega2400_part_59.pgn
mega2400_part_60.pgn		mega2400_part_60.pgn
mega2400_part_61.pgn		mega2400_part_61.pgn
mega2400_part_62.pgn		mega2400_part_62.pgn
mega2400_part_63.pgn		mega2400_part_63.pgn
mega2400_part_64.pgn		mega2400_part_64.pgn
mega2400_part_65.pgn		mega2400_part_65.pgn
mega2400_part_66.pgn		mega2400_part_66.pgn
mega2400_part_67.pgn		mega2400_part_67.pgn
mega2400_part_68.pgn		mega2400_part_68.pgn
mega2400_part_69.pgn		mega2400_part_69.pgn
mega2400_part_70.pgn		mega2400_part_70.pgn
mega2400_part_71.pgn		mega2400_part_71.pgn
mega2400_part_72.pgn		mega2400_part_72.pgn
mega2400_part_73.pgn		mega2400_part_73.pgn
mega2400_part_74.pgn		mega2400_part_74.pgn
mega2400_part_75.pgn		mega2400_part_75.pgn
mega2400_part_76.pgn		mega2400_part_76.pgn
mega2400_part_77.pgn		mega2400_part_77.pgn
mega2400_part_78.pgn		mega2400_part_78.pgn

Repository files navigation

ChessData

PGN Mirror. There will be dups, dirty data, errors, GM draws etc -- the data will probably need to be post-processed, filtered, deduped etc.

In the news:

Command-line tools can be 235x faster than your Hadoop cluster

The first thing to do is get a lot of game data. This proved more difficult than I thought it would be, but after some looking around online I found a git repository on GitHub from rozim that had plenty of games. I used this to compile a set of 3.46GB of data, which is about twice what Tom used in his test. The next step is to get all that data into our pipeline

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ChessData

In the news:

About

Releases

Packages

Languages

ninki51/ChessData

Folders and files

Latest commit

History

Repository files navigation

ChessData

In the news:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages