各種データのやり取りをする際に頻繁に使用されるCSVファイルですが、なんとなくで使っている方も多いのではないでしょうか。
そこで、今回はCSVの基礎知識をはじめ、悩む方が多い「,(カンマ)」の扱いまで解説します。興味を持った方は、ぜひ最後までご覧ください。
目次
そもそもCSVとは?
CSVとは「Comma Separated Values」の略で、読んで字のごとくカンマで区切られたデータを意味します。
容量が軽く、書き出しがスムーズな点が特徴です。また、互換性と汎用性も高く、DX推進や業務効率化のキーになり得ます。
CSVで「,(カンマ)」が認識されない
カンマはCSVにおいて、データを区切る役割を担う存在です。しかし、文字列にカンマが含まれていると、変な場所で区切りが発生します。
その場合は、以下の対処法でカンマを文字列として認識させなければなりません。
対処方法
カンマを「”(ダブルクオート)」で囲うと、文字列として認識させることが可能です。ただし、ダブルクオートで囲われていても、文字列に「”(ダブルクオート)」が入ると、次のカンマは区切り文字と認識されます。
どうしてもカンマとダブルクオート、両方の入力が必須の場合は、エスケープの処理を開発の際に該当カラムに加えましょう。また、ダブルクオートのみならず「’(シングルクオート)」で囲っても区切り文字と認識されます。
CSVのよくあるトラブルと対処法3選!
CSVを扱っている際、さまざまなトラブルに見舞われるものです。以下では、CSVで発生しやすいトラブルの対処方法を紹介します。
文字化けしたときの対処方法
Windowsの場合は、メモ帳でCSVを開きましょう。それから文字コードを展開してANSI、またはUTF-8(BOM付き)を選択します。メモ帳以外のテキストエディタを使用する場合は、文字コードをSJISにしましょう。
Macも基本的な流れは一緒ですが、こちらではメモ帳ではなくテキストエディットを開きます。それからShift_JIS、またはUnicode(UTF-16)を文字コードに設定してください。
データが日付に変換されてしまうときの対処方法
データが日付に変換されるのは、アンケートフォームや顧客情報などでありがちなトラブルです。CSVをExcelで開いたときに発生しやすいため、一旦メモ帳やテキストエディタなどで開いてください。
以降は、以下の手順で設定を行います。
- 「データ」タブの「データツール」グループの「区切り位置」ボタンをクリック
- 「コンマやタブなどの区切り文字によってフィールドごとに区切られたデータ」を選択して「次へ」ボタンをクリック
- 「区切り文字」で「コンマ」を選択
- 変換されたくない列をクリックして「列のデータ形式」で「文字列」を選択し、「完了」ボタンをクリック
先頭の0が消えてしまうときの対処方法
いわゆる0落ちと呼ばれる現象で、セルの表示形式を「標準」にすると発生します。列の書式を指定する、元データを「=””」で囲んで最初から文字列として認識させるなどが有効な方法です。
まとめ
以上、CSVのカンマにまつわるトラブル、そして対処法について取り上げてきました。CSVは、使い方によっては作業効率を高めてくれる心強い存在になります。
今回取り上げた内容を参考に、みなさんもCSVを有効活用できるようになりましょう。
デジタル領域でのお困り事やプロダクト開発について、まずはお気軽にご相談ください。
お問い合わせはこちら