Pythonを学習し始めた頃に、pandasのpd.read_csv()によってcsvファイルを開く方法を習得するかと思います。
ところが、Signate(シグネート)をやっていて、学習用データとしてcsv形式ではなくtsv形式のファイルが与えられることがあります。
そもそもtsvってなによ?どうやって開けばいいのよ?って思った方に向けて、端的に説明します。
csvファイルの読み込み方法
pandasで次のコードで読み込むことができます。こちらはみなさんご存知かと思います。
tsvファイルの読み込み方法
tsvの場合は、こちらのコードを使います。
なんともシンプルです。
csvとtsvの違い
csvはComma-Separated Valuesの略です。文字通り、それぞれの要素がカンマ(,)で区切られただけのファイルです。
一方、tsvはTab-Separated Valuesの略です。文字通り、それぞれの要素がタブ( )で区切られただけのファイルです。
私たちが目にするのはほとんどがcsvファイルだと思います。tsvはマイナーです。
とはいえ、Pythonでプログラミングを書いているとtsvファイルに時々遭遇しますので、知っておいて損はないと思います。