Wikipediaのダンプをインポートする際のTips

Wikimedia Downloads

上記ページで公開されているWikipediaMySQLテーブルダンプですが、何しろサイズが巨大で、そのままインポートしようとすると色々大変です。特に英語版Wikipediaは巨大すぎます。なので、インポート前にダンプファイルをいじっておいた方が良いと思います。

まず、使い道がないと思われるインデックスを削除します。例えばUNIQUE KEYは本家Wikipediaでは必要でも、読み込み専用の場合は不要なので削除。ついでに、エンジンをInnoDBからMyISAMに変更しておきます。

こうすることで、インポート自体も高速化できるし、後でALTER TABLEするときにも楽だと思います。InnoDBはとにかくALTER TABLEが重いですからね〜。