アプリでもっと教えて！goo

アプリ版：「スタンプのみでお礼する」機能のリリースについて

VC++でUTF-8のファイルを出力したい

締切済

質問者：bigbang2010
質問日時：2011/07/21 20:51
回答数：5件

VisualStudio2005で以下のコードを実行したとき、ファイルをUTF-8で作成したいのですが、なにか方法がありますか？
現状では、SJISで出力されてしまいます。
ソースは、『ファイル』-『保存オプションの詳細設定』で『UTF-8（BOM付き）』にしてあります。

#include <stdio.h>

int main(int argc, char* argv[])
{
　　　　FILE *fp;

　　　　fp = fopen( "c:/temp/log.txt", "w");

　　　　fprintf( fp, "%s\n", "あいうえお" );

　　　　fclose( fp );

　　　　return 0;
}

ちなみに、”あいうえお”の部分を（EmEditorで）SJISに無くてUTF-8にだけ存在する文字にした場合、VisualStudioのエディタ上では正しく文字が表示されます。
したがって、VisualStudio内ではリテラルの文字コードはUTF-8で扱われていると考えられます。・・・が、上記プログラムで出力すると文字化けします。つまり、SJISで出力されてしまいます。

ご教授のほど、よろしくお願いいたします。

この質問への回答は締め切られました。

質問の本文を隠す

回答 (5件)

最新から表示
回答順に表示

No.5

回答者： jx-word
回答日時：2011/07/22 23:49

再回答で。

よく見たらソース全体がUnicode用になってないですよね、これ。

int main(int argc, char* argv[])
↓
int _tmain(int argc, _TCHAR* argv[])

fp = fopen( "c:/temp/log.txt", "w");
↓
fp = _tfopen( _T( "c:/temp/log.txt" ), _T( "w, ccs=UTF-8" ) );

fprintf( fp, "%s\n", "あいうえお" );
↓
_tfopen( fp, _T( "%s\n" ), _T( "あいうえお" ) );

_UNICODEを定義する。
tchar.hをインクルードする。

などの変更が必要です。
詳細はマニュアルの「Unicode プログラミングの要約」辺りを参照してください。

- 0
- 件

この回答へのお礼

お礼が遅れて申し訳ありません。
現在別件作業中で、この問題は別担当者に任せていました。
現在の解決策としては、リテラル文字列使用時にsjis→UTF-8変換して動かしている状態です。
ご回答いただいた件、調査してみます。コンパイラオプションではなく、_UNICODEを定義することによってオブジェクトがUTF-8になる…ということ？ですかね。このようなことは、コンパイルオプションでやるものだとばかり思っていました。

色々な流れで、今回のコードはワンソースでWinとLINUX両方で動かす可能性が大です。したがって、Win独自のコーディングが出来ない（部分的なifdefはありますが）可能性大です。ご回答いただいた件がgcc（g++）で可能なのか合わせて調べてみたいと思います。

Win環境だけでの文字コード関係なしプログラミング…勉強不足を痛感です。

お礼日時：2011/08/05 10:29

No.4

回答者： Wr5
回答日時：2011/07/22 13:14

>したがって、UTF-8で書かれたソースコードがVisualStudioのエディタで正しく表示されているにもかかわらず、その文字列を出力するとsjisになってしまうのです。

出力したファイル(c:/temp/log.txt)がShift-JISになっている。
というのはどのように確認しましたか？
BOM付きで出力されていない場合、エディタの自動認識では失敗(UTF-8のつもりがShift-JIS)することもありますが…。
秀丸Ver8.10の自動認識ではShift-JISとして認識される。
そこからエンコーディングをUTF-8にして読み込みし直すとは『羽かんむりに軍（UTF-8コード0xE7,0xBF,0xAC）』になります。
もちろん、バイナリエディタで覗くと0xE7 0xBF 0xAC 0x0D 0x0Aです。
さらに、名前をつけて保存でBOM付きで保存して開き直すと、普通にUTF-8になります。
ソースファイルがBOM付きでも、そのコードから出力されるファイルには関係ないコトでしょう……。
# 実行バイナリ中のデータには影響するかも知れませんが…

fprintf()でなぜかDebug Assertionになってしまいます……＞#3
fopen()でオープンはできるんですけど。
# VS2005SP1とVC++2008EE SP1で確認…。

この回答への補足

ご回答ありがとうございます。

出力したファイル(c:/temp/log.txt)がShift-JISになっている。
というのはどのように確認しましたか？
　→ EmEditorとVisualStudioのバイナリエディタで確認しました。

ソースファイルがBOM付きでも、そのコードから出力されるファイルには関係ないコトでしょう……。
　→ おっしゃる通りです。

私も、VS2005SP1で『No.3　jx-word』様の方法を試してみましたが、Assertionとなってしまいました。

補足日時：2011/07/22 13:53

- 0
- 件

この回答へのお礼

皆様ありがとうございました。
結局、オブジェクトコードがUTF-8にならない限り、出力時のsjis→UTF-8変換が必用になるということですね。
先程exe内でリテラル文字列がsjisになっていることを確認しました。

追加確認結果です。
sjis範囲外のUTF-8（例えば羽かんむりに軍）はVisualStudioのエディタ上では表示されますが、オブジェクトコード上では0x3f（?）になってしまいます。
したがって、sjis→UTF-8変換も出来ないと思われます。0x3fはどう変換しても0x3fですから。

お礼日時：2011/07/22 19:38

No.3

回答者： jx-word
回答日時：2011/07/22 11:38

VS2005であればfopenの下記のパラメータ指定でいけるはずです。

fp = fopen("c:/temp/log.txt", "w, ccs=UTF-8");

詳細はマニュアルのfopenの項を参照してください。

この回答への補足

ご回答ありがとうございます。

VisualStudio2005+SP1で上記方法を試してみましたが、fprintf()でAssertionとなってしまいました。
『これだ！』と思ったんですけど…

補足日時：2011/07/22 13:52

- 0
- 件

この回答へのお礼

皆様ありがとうございました。
結局、オブジェクトコードがUTF-8にならない限り、出力時のsjis→UTF-8変換が必用になるということですね。
先程exe内でリテラル文字列がsjisになっていることを確認しました。

追加確認結果です。
sjis範囲外のUTF-8（例えば羽かんむりに軍）はVisualStudioのエディタ上では表示されますが、オブジェクトコード上では0x3f（?）になってしまいます。
したがって、sjis→UTF-8変換も出来ないと思われます。0x3fはどう変換しても0x3fですから。

お礼日時：2011/07/22 19:38

No.2

回答者： Yune-Kichi
回答日時：2011/07/22 10:47

ソースファイルの文字コードが何であれ，コンパイル時に想定されるexecution character setが，

日本語環境においてShift_JISから変化するわけではありません。
# source character setが変化するだけ。

想定されるexecution character setへの変換はコンパイル時に行われるため，
・ソースファイル中ではwide string literalを使う
・必要に応じてUTF-16からUTF-8に変換する
という二段階で行う必要があります。
# chcp 65001したコマンドプロンプトでビルドすれば想定がUTF-8になるかもしれませんが，試していません。

この回答への補足

『想定されるexecution character setへの変換はコンパイル時に行われるため・・・』
　→ と、言うことはコンパイル時にUTF-8のオブジェクトが出力できればいいわけですよね。
　→ Linux環境のgcc(g++)はコンパイルオプション『-fexec-charset=xxxxx』があります。
　　たしかに、この機能を使ってLinux上でsjisのファイル操作（リテラル文字列を検索したり…）
　　したことがあります。

しかしながら、VisualStudioのコンパイルオプションには・・・見つけられませんでした。
これが出来れば、コーディング的にも綺麗に行けるんですけどね。

補足日時：2011/07/22 13:41

- 0
- 件

この回答へのお礼

皆様ありがとうございました。
結局、オブジェクトコードがUTF-8にならない限り、出力時のsjis→UTF-8変換が必用になるということですね。
先程exe内でリテラル文字列がsjisになっていることを確認しました。

追加確認結果です。
sjis範囲外のUTF-8（例えば羽かんむりに軍）はVisualStudioのエディタ上では表示されますが、オブジェクトコード上では0x3f（?）になってしまいます。
したがって、sjis→UTF-8変換も出来ないと思われます。0x3fはどう変換しても0x3fですから。

お礼日時：2011/07/22 19:39

No.1

回答者： episteme
回答日時：2011/07/21 21:31

Shift_JIS→UTF-8 変換かけるだけじゃないかと。

WideCharToMultiByte、MultiByteToWideChar　使えばたいした手間ではないでしょう。

この回答への補足

早速のご回答ありがとうございます。
確かにソースコードがsjisであればUTF-8変換すればOKです。

ところが、このソースコードはすでにUTF-8なのです。質問のところで『”あいうえお”の部分を…』と書きましたが、ここには実際には『羽かんむりに軍（UTF-8コード0xE7,oxBF,0xAC）』が書かれています。そして、VisualStudioのエディタでは、『羽かんむりに軍』は表示されています。
したがって、UTF-8で書かれたソースコードがVisualStudioのエディタで正しく表示されているにもかかわらず、その文字列を出力するとsjisになってしまうのです。

話を簡単にするために『あいうえお』と書いたために誤解させてしまったかもしれません。すみませんでした。
…というわけです。
ちなみに、『羽かんむりに軍』はsjisには無い文字です。

補足日時：2011/07/22 10:59

- 0
- 件

この回答へのお礼

皆様ありがとうございました。
結局、オブジェクトコードがUTF-8にならない限り、出力時のsjis→UTF-8変換が必用になるということですね。
先程exe内でリテラル文字列がsjisになっていることを確認しました。

追加確認結果です。
sjis範囲外のUTF-8（例えば羽かんむりに軍）はVisualStudioのエディタ上では表示されますが、オブジェクトコード上では0x3f（?）になってしまいます。
したがって、sjis→UTF-8変換も出来ないと思われます。0x3fはどう変換しても0x3fですから。

さっき気付きましたが「επιστημη」さんだったんですね。DDJJ読んでました。光栄です。

お礼日時：2011/07/22 19:40

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう！

質問する（無料）

似たような質問が見つかりました

C言語・C++・C# このプログラミング誰か教えてくれませんか 1 2022/06/02 15:27
C言語・C++・C# プログラミングの授業の課題です 1 2023/01/17 22:15
UNIX・Linux テキストファイルをページ番号付きでコマンドラインから印刷したい 1 2023/02/22 12:47
Excel（エクセル）エクセルのVBAについてとあるサイトのコードを参考に、CSVの文字化けを直すVBAを作成しているの 7 2022/11/04 14:15
C言語・C++・C# c言語の問題の説明、各所ごとに 5 2023/07/26 11:03
C言語・C++・C# バイナリファイルをコピーするのにかかる時間を測りたいのですが実行するとFatel error:gli 2 2022/11/03 01:10
PHP phpのメールフォームの完了画面でメール受信のコードを書いています。 1 2023/05/31 11:39
C言語・C++・C# c言語プログラムのエラー 1 2023/02/11 20:31
Excel（エクセル）文字化け。メモ帳でUTF-8に変換後、エクセルへ貼り付けたいです。 3 2022/08/14 07:21
Excel（エクセル） Excelにて、フォルダ内のTextファイルをマクロで統合すると文字化けしてしまう時の解消コード 4 2023/01/01 07:32

このQ&Aを見た人はこんなQ&Aも見ています

関連するカテゴリからQ&Aを探す

ページトップ

おすすめ情報

質問する（無料）

このQ&Aを見た人がよく見るQ&A

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

おすすめ情報