
VisualStudio2005で以下のコードを実行したとき、ファイルをUTF-8で作成したいのですが、なにか方法がありますか?
現状では、SJISで出力されてしまいます。
ソースは、『ファイル』-『保存オプションの詳細設定』で『UTF-8(BOM付き)』にしてあります。
#include <stdio.h>
int main(int argc, char* argv[])
{
FILE *fp;
fp = fopen( "c:/temp/log.txt", "w");
fprintf( fp, "%s\n", "あいうえお" );
fclose( fp );
return 0;
}
ちなみに、”あいうえお”の部分を(EmEditorで)SJISに無くてUTF-8にだけ存在する文字にした場合、VisualStudioのエディタ上では正しく文字が表示されます。
したがって、VisualStudio内ではリテラルの文字コードはUTF-8で扱われていると考えられます。・・・が、上記プログラムで出力すると文字化けします。つまり、SJISで出力されてしまいます。
ご教授のほど、よろしくお願いいたします。
A 回答 (5件)
- 最新から表示
- 回答順に表示
No.5
- 回答日時:
再回答で。
よく見たらソース全体がUnicode用になってないですよね、これ。
int main(int argc, char* argv[])
↓
int _tmain(int argc, _TCHAR* argv[])
fp = fopen( "c:/temp/log.txt", "w");
↓
fp = _tfopen( _T( "c:/temp/log.txt" ), _T( "w, ccs=UTF-8" ) );
fprintf( fp, "%s\n", "あいうえお" );
↓
_tfopen( fp, _T( "%s\n" ), _T( "あいうえお" ) );
_UNICODEを定義する。
tchar.hをインクルードする。
などの変更が必要です。
詳細はマニュアルの「Unicode プログラミングの要約」辺りを参照してください。
お礼が遅れて申し訳ありません。
現在別件作業中で、この問題は別担当者に任せていました。
現在の解決策としては、リテラル文字列使用時にsjis→UTF-8変換して動かしている状態です。
ご回答いただいた件、調査してみます。コンパイラオプションではなく、_UNICODEを定義することによってオブジェクトがUTF-8になる…ということ?ですかね。このようなことは、コンパイルオプションでやるものだとばかり思っていました。
色々な流れで、今回のコードはワンソースでWinとLINUX両方で動かす可能性が大です。したがって、Win独自のコーディングが出来ない(部分的なifdefはありますが)可能性大です。ご回答いただいた件がgcc(g++)で可能なのか合わせて調べてみたいと思います。
Win環境だけでの文字コード関係なしプログラミング…勉強不足を痛感です。
No.4
- 回答日時:
>したがって、UTF-8で書かれたソースコードがVisualStudioのエディタで正しく表示されているにもかかわらず、その文字列を出力するとsjisになってしまうのです。
出力したファイル(c:/temp/log.txt)がShift-JISになっている。
というのはどのように確認しましたか?
BOM付きで出力されていない場合、エディタの自動認識では失敗(UTF-8のつもりがShift-JIS)することもありますが…。
秀丸Ver8.10の自動認識ではShift-JISとして認識される。
そこからエンコーディングをUTF-8にして読み込みし直すとは『羽かんむりに軍(UTF-8コード0xE7,0xBF,0xAC)』になります。
もちろん、バイナリエディタで覗くと0xE7 0xBF 0xAC 0x0D 0x0Aです。
さらに、名前をつけて保存でBOM付きで保存して開き直すと、普通にUTF-8になります。
ソースファイルがBOM付きでも、そのコードから出力されるファイルには関係ないコトでしょう……。
# 実行バイナリ中のデータには影響するかも知れませんが…
fprintf()でなぜかDebug Assertionになってしまいます……>#3
fopen()でオープンはできるんですけど。
# VS2005SP1とVC++2008EE SP1で確認…。
この回答への補足
ご回答ありがとうございます。
出力したファイル(c:/temp/log.txt)がShift-JISになっている。
というのはどのように確認しましたか?
→ EmEditorとVisualStudioのバイナリエディタで確認しました。
ソースファイルがBOM付きでも、そのコードから出力されるファイルには関係ないコトでしょう……。
→ おっしゃる通りです。
私も、VS2005SP1で『No.3 jx-word』様の方法を試してみましたが、Assertionとなってしまいました。
皆様ありがとうございました。
結局、オブジェクトコードがUTF-8にならない限り、出力時のsjis→UTF-8変換が必用になるということですね。
先程exe内でリテラル文字列がsjisになっていることを確認しました。
追加確認結果です。
sjis範囲外のUTF-8(例えば羽かんむりに軍)はVisualStudioのエディタ上では表示されますが、オブジェクトコード上では0x3f(?)になってしまいます。
したがって、sjis→UTF-8変換も出来ないと思われます。0x3fはどう変換しても0x3fですから。
No.3
- 回答日時:
VS2005であればfopenの下記のパラメータ指定でいけるはずです。
fp = fopen("c:/temp/log.txt", "w, ccs=UTF-8");
詳細はマニュアルのfopenの項を参照してください。
この回答への補足
ご回答ありがとうございます。
VisualStudio2005+SP1で上記方法を試してみましたが、fprintf()でAssertionとなってしまいました。
『これだ!』と思ったんですけど…
皆様ありがとうございました。
結局、オブジェクトコードがUTF-8にならない限り、出力時のsjis→UTF-8変換が必用になるということですね。
先程exe内でリテラル文字列がsjisになっていることを確認しました。
追加確認結果です。
sjis範囲外のUTF-8(例えば羽かんむりに軍)はVisualStudioのエディタ上では表示されますが、オブジェクトコード上では0x3f(?)になってしまいます。
したがって、sjis→UTF-8変換も出来ないと思われます。0x3fはどう変換しても0x3fですから。
No.2
- 回答日時:
ソースファイルの文字コードが何であれ,コンパイル時に想定されるexecution character setが,
日本語環境においてShift_JISから変化するわけではありません。
# source character setが変化するだけ。
想定されるexecution character setへの変換はコンパイル時に行われるため,
・ソースファイル中ではwide string literalを使う
・必要に応じてUTF-16からUTF-8に変換する
という二段階で行う必要があります。
# chcp 65001したコマンドプロンプトでビルドすれば想定がUTF-8になるかもしれませんが,試していません。
この回答への補足
『想定されるexecution character setへの変換はコンパイル時に行われるため・・・』
→ と、言うことはコンパイル時にUTF-8のオブジェクトが出力できればいいわけですよね。
→ Linux環境のgcc(g++)はコンパイルオプション『-fexec-charset=xxxxx』があります。
たしかに、この機能を使ってLinux上でsjisのファイル操作(リテラル文字列を検索したり…)
したことがあります。
しかしながら、VisualStudioのコンパイルオプションには・・・見つけられませんでした。
これが出来れば、コーディング的にも綺麗に行けるんですけどね。
皆様ありがとうございました。
結局、オブジェクトコードがUTF-8にならない限り、出力時のsjis→UTF-8変換が必用になるということですね。
先程exe内でリテラル文字列がsjisになっていることを確認しました。
追加確認結果です。
sjis範囲外のUTF-8(例えば羽かんむりに軍)はVisualStudioのエディタ上では表示されますが、オブジェクトコード上では0x3f(?)になってしまいます。
したがって、sjis→UTF-8変換も出来ないと思われます。0x3fはどう変換しても0x3fですから。
No.1
- 回答日時:
Shift_JIS→UTF-8 変換かけるだけじゃないかと。
WideCharToMultiByte、MultiByteToWideChar 使えばたいした手間ではないでしょう。
この回答への補足
早速のご回答ありがとうございます。
確かにソースコードがsjisであればUTF-8変換すればOKです。
ところが、このソースコードはすでにUTF-8なのです。質問のところで『”あいうえお”の部分を…』と書きましたが、ここには実際には『羽かんむりに軍(UTF-8コード0xE7,oxBF,0xAC)』が書かれています。そして、VisualStudioのエディタでは、『羽かんむりに軍』は表示されています。
したがって、UTF-8で書かれたソースコードがVisualStudioのエディタで正しく表示されているにもかかわらず、その文字列を出力するとsjisになってしまうのです。
話を簡単にするために『あいうえお』と書いたために誤解させてしまったかもしれません。すみませんでした。
…というわけです。
ちなみに、『羽かんむりに軍』はsjisには無い文字です。
皆様ありがとうございました。
結局、オブジェクトコードがUTF-8にならない限り、出力時のsjis→UTF-8変換が必用になるということですね。
先程exe内でリテラル文字列がsjisになっていることを確認しました。
追加確認結果です。
sjis範囲外のUTF-8(例えば羽かんむりに軍)はVisualStudioのエディタ上では表示されますが、オブジェクトコード上では0x3f(?)になってしまいます。
したがって、sjis→UTF-8変換も出来ないと思われます。0x3fはどう変換しても0x3fですから。
さっき気付きましたが「επιστημη」さんだったんですね。DDJJ読んでました。光栄です。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- C言語・C++・C# このプログラミング誰か教えてくれませんか 1 2022/06/02 15:27
- C言語・C++・C# プログラミングの授業の課題です 1 2023/01/17 22:15
- UNIX・Linux テキストファイルをページ番号付きでコマンドラインから印刷したい 1 2023/02/22 12:47
- Excel(エクセル) エクセルのVBAについて とあるサイトのコードを参考に、CSVの文字化けを直すVBAを作成しているの 7 2022/11/04 14:15
- C言語・C++・C# c言語の問題の説明、各所ごとに 5 2023/07/26 11:03
- C言語・C++・C# バイナリファイルをコピーするのにかかる時間を測りたいのですが実行するとFatel error:gli 2 2022/11/03 01:10
- PHP phpのメールフォームの完了画面でメール受信のコードを書いています。 1 2023/05/31 11:39
- C言語・C++・C# c言語 プログラムのエラー 1 2023/02/11 20:31
- Excel(エクセル) 文字化け。メモ帳でUTF-8に変換後、エクセルへ貼り付けたいです。 3 2022/08/14 07:21
- Excel(エクセル) Excelにて、フォルダ内のTextファイルをマクロで統合すると文字化けしてしまう時の解消コード 4 2023/01/01 07:32
このQ&Aを見た人はこんなQ&Aも見ています
-
初めて見た映画を教えてください!
初めて見た映画を覚えていますか?
-
おすすめの美術館・博物館、教えてください!
美術館・博物館が大好きです。みなさんのおすすめをぜひお聞きしたいです。
-
最強の防寒、あったか術を教えてください!
とっても寒がりなのですが、冬に皆さんがされている最強の防寒、あったか術が知りたいです!
-
あなたの人生で一番ピンチに陥った瞬間は?
これまでの人生で今振り返ると「あの時、1番ピンチだったなぁ...」という瞬間はありますか?
-
一番好きなみそ汁の具材は?
みんなで大好きなみそ汁の具材について語り合おうよっ!
-
_tfopen について教えてください
C言語・C++・C#
-
CStringのFindで文字列検索を行いたいのですが
C言語・C++・C#
-
unicode文字列(日本語)のファイル出力方法
C言語・C++・C#
-
-
4
charからLPTSTRへの変換方法
C言語・C++・C#
-
5
ファイル書込みで一行もしくは部分的に上書きする
PHP
-
6
CStringからchar*への型変換について教えてください。
C言語・C++・C#
-
7
C++言語で、構造体のコピーは可能(しても良い)のでしょうか?
C言語・C++・C#
-
8
CStringをwchar_tに変換したい
C言語・C++・C#
-
9
ファイル読み込みについて
C言語・C++・C#
-
10
CString から LPCTSTRの型に変換
C言語・C++・C#
-
11
std::stringからLPCWSTR型への変換
C言語・C++・C#
-
12
fgets で値が取得できない
C言語・C++・C#
-
13
CString型 全角半角を意識せずに「1文字」ずつ取り出す
C言語・C++・C#
-
14
visual c++でutf-8の扱い
C言語・C++・C#
-
15
gccによって、BOM付きのUTF-8で出力する
C言語・C++・C#
-
16
<unistd.h>をVisualStudioでつかえるようにする
C言語・C++・C#
-
17
INT64対応のprintf系関数はありますか?
C言語・C++・C#
-
18
CFileDialogの最初のディレクトリ設定
C言語・C++・C#
-
19
fgetsで2行目から文字化け
C言語・C++・C#
-
20
fprintfで文字化け
C言語・C++・C#
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・一番好きなみそ汁の具材は?
- ・泣きながら食べたご飯の思い出
- ・「これはヤバかったな」という遅刻エピソード
- ・初めて自分の家と他人の家が違う、と意識した時
- ・いちばん失敗した人決定戦
- ・思い出すきっかけは 音楽?におい?景色?
- ・あなたなりのストレス発散方法を教えてください!
- ・もし10億円当たったら何に使いますか?
- ・何回やってもうまくいかないことは?
- ・今年はじめたいことは?
- ・あなたの人生で一番ピンチに陥った瞬間は?
- ・初めて見た映画を教えてください!
- ・今の日本に期待することはなんですか?
- ・集中するためにやっていること
- ・テレビやラジオに出たことがある人、いますか?
- ・【お題】斜め上を行くスキー場にありがちなこと
- ・人生でいちばんスベッた瞬間
- ・コーピングについて教えてください
- ・あなたの「プチ贅沢」はなんですか?
- ・コンビニでおにぎりを買うときのスタメンはどの具?
- ・おすすめの美術館・博物館、教えてください!
- ・【お題】大変な警告
- ・洋服何着持ってますか?
- ・みんなの【マイ・ベスト積読2024】を教えてください。
- ・「これいらなくない?」という慣習、教えてください
- ・今から楽しみな予定はありますか?
- ・AIツールの活用方法を教えて
- ・最強の防寒、あったか術を教えてください!
- ・歳とったな〜〜と思ったことは?
- ・モテ期を経験した方いらっしゃいますか?
- ・好きな人を振り向かせるためにしたこと
- ・スマホに会話を聞かれているな!?と思ったことありますか?
- ・それもChatGPT!?と驚いた使用方法を教えてください
- ・見学に行くとしたら【天国】と【地獄】どっち?
- ・これまでで一番「情けなかったとき」はいつですか?
- ・この人頭いいなと思ったエピソード
- ・あなたの「必」の書き順を教えてください
- ・14歳の自分に衝撃の事実を告げてください
- ・人生最悪の忘れ物
- ・あなたの習慣について教えてください!!
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
コマンド(例えばls)の出力結果...
-
Acccess レポートをグループ別...
-
OCRで起こしたテキスト文字をCS...
-
ファイルの文字コードをUTF-8に...
-
Accessでのレポート印刷待機方法
-
Wordマクロで指定したフォルダ...
-
CSV形式に変換
-
fwprintf()について
-
ファイルI/O完了待ち
-
(VBA)書式が変更されてしまい...
-
スレッドセーフでないAPIをマル...
-
VC++での外部ファイル(batファ...
-
CBool関数について VB6とVB.net...
-
VBAでエクセルをCSVに変換時
-
構造体のファイル出力
-
標準出力とファイルに効率的に...
-
複数のC言語プログラムが,一つ...
-
シェルコマンドの 2>&1 とはど...
-
高速置換の方法
-
【ExcelVBA】UTF-8(BOM無)でC...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
コマンド(例えばls)の出力結果...
-
VC++でUTF-8のファイルを出力し...
-
ファイル出力の場所を指定
-
シェルコマンドの 2>&1 とはど...
-
【ExcelVBA】UTF-8(BOM無)でC...
-
ファイル形式またはファイル拡...
-
BitBltについて。
-
Wordマクロで指定したフォルダ...
-
外国語とCSVについて
-
Acccess レポートをグループ別...
-
ファイルの文字コードをUTF-8に...
-
テキストファイルに改行コード...
-
MS-Word で作成した表をLatexに...
-
サウンド出力のデバイスを選択...
-
CBool関数について VB6とVB.net...
-
拡張子.vsdをイラストレーター...
-
pLaTeX の EPSファイル読み込み...
-
CSVファイルを任意の場所に出力...
-
pcap形式データをテキストへ抽出
-
VBAでエクセルをCSVに変換時
おすすめ情報