Python、機械学習

【Python】csvファイルとtsvファイルをPandasで読み込む方法

Pythonを学習し始めた頃に、pandasのpd.read_csv()によってcsvファイルを開く方法を習得するかと思います。

ところが、Signate(シグネート)をやっていて、学習用データとしてcsv形式ではなくtsv形式のファイルが与えられることがあります。

そもそもtsvってなによ?どうやって開けばいいのよ?って思った方に向けて、端的に説明します。

csvファイルの読み込み方法

pandasで次のコードで読み込むことができます。こちらはみなさんご存知かと思います。

df = pd.read_csv('〇〇.csv')
df

tsvファイルの読み込み方法

tsvの場合は、こちらのコードを使います。

df = pd.read_table('〇〇.tsv')
df

なんともシンプルです。

csvとtsvの違い

csvはComma-Separated Valuesの略です。文字通り、それぞれの要素がカンマ(,)で区切られただけのファイルです。

一方、tsvはTab-Separated Valuesの略です。文字通り、それぞれの要素がタブ( )で区切られただけのファイルです。

私たちが目にするのはほとんどがcsvファイルだと思います。tsvはマイナーです。

とはいえ、Pythonでプログラミングを書いているとtsvファイルに時々遭遇しますので、知っておいて損はないと思います。