ちょっと変わったマニアな作品が集結

ワイド文字のバイト数を求めたいのですが、文字数しか取得することが出来ません。
ワイド文字のバイト数を取得する事は出来ないのでしょうか?

Visual C++ 2008 Express Edhition の デバックモードで動かしています。

******************************
wchar_t s[256];
s = L"abcあいう";
int len = wcslen(s);
******************************

このQ&Aに関連する最新のQ&A

A 回答 (10件)

#5です。


>UTF-8で読み込んだファイルの中身を半角を1バイト、全角を2バイトとしてバイト数を計算したいのです。

ですから、なんのためにそんな計算がしたいのか、ということです。
そもそも、半角/全角というのはSJIS固有の概念といってもいいです。
なので、SJISに変換するのでない限り、意味の無い計算です。
#細かいことを言うと、unicodeにも、半角/全角という言葉は出てきますが、意味が違います。

UFT-8には、SJISには存在しない文字がありますから、変換してしまうと、情報が落ちてしまいます。それは構わないのでしょうか?
情報が落ちて困るのなら、SJISに変換はできませんし、そうなると、半角/全角といった話も不要です。どうなのでしょうか。

この回答への補足

なんどもありがとうございます。
UTF-8で書かれた1G越えのファイルを開き、中身を取得したいと思っております。
中身が1Gを超えるので一度に展開できず、数回に分けて取得しようと考えております。
1回に取得するサイズを決めて中身を取り出し、次に取得する場合は1回目に取得した次のデータから取得したいのですが、うまくバイト数を取得できずデータが切れてしまっているのが現状です。
その計算に必要なバイトを取得したいと考えております。

補足日時:2008/10/17 15:03
    • good
    • 0

#3です。

補足ありがとうございます。

別枠で質問したのはいい判断だと思います。
しかし、知りたいバイト数とは一体何なのでしょうか。半角文字1バイト、全角文字2バイトだとすると、SJISですか?
開いているファイルはUTF-8ですよね。本当にSJISのバイト数でいいのですか?

また、念のため明記しますが、UTF-8のバイト数とSJISのバイト数は違うものになります。
補足をよろしくお願いします。
    • good
    • 0
この回答へのお礼

返信が遅れ申し訳ありません。
自分の知識不足から自分のやりたい事と質問内容がずれてきているように思えます。
一度整理して改めて質問させていただきます。
ご回答くださいました方々ありがとうございました。

お礼日時:2008/10/20 14:38

> UTF-8で読み込んだファイルの中身を半角を1バイト



UTF-8だと、半角カナは3バイト文字になりますが、それでも1バイトとして数えるのでしょうか?
    • good
    • 1

#6です。


>http://okwave.jp/qa4406429.html
こちらの質問の続きだとしますと、
FILE *file1;
wchar_t s[256];
file1 = fopen( "C:\\readme", "r, ccs=UTF-8");
while (fgetws(s, 256, file1) != NULL)
{
:
:
}
といった感じで前回の続きから文字を読んでこれます。これではなにか問題があるのでしょうか?
    • good
    • 0

文字列のバイト数なら文字コード関係なしに


int len = strlen(s);
でいいのでは
    • good
    • 0

#4です。


>質問の通りにバイト数を取得したのです。
ワイド文字でのバイト数であれば、
(wcslen(s)+1)*2
です。これ以外はありえません。
全角、半角と言い出した時点ですでにワイド文字の話ではなくなるのです。
なので、「何での」バイト数が必要なのかが肝心なのです。
SJISでのバイト数が必要ならば、MBCSに変換するのが有効ですし、そうでないならば、また別の方法が必要となることでしょう。

この回答への補足

勉強不足ですみません。
UTF-8で読み込んだファイルの中身を半角を1バイト、全角を2バイトとしてバイト数を計算したいのです。
UTF-8のファイルを開くにはワイド文字で取得するしかないようなので、一旦ワイド文字で取得 -> 計算の流れを考えております。
他方法があればご教授ください。

補足日時:2008/10/17 14:15
    • good
    • 0

>バイト数に関してですが、「abcあいう」だった場合は9バイトとしてカウントしたいのです。


>ただ、半角は1バイト、全角は2バイトとして計算したいので、他の方法を考えてみます。
ワイド文字は全角半角かかわらず、一文字2バイトです。
なので、1バイトとして計算したい文字と、2バイトとして計算したい文字とを自分で定義して、自分で計算するしかないですね。

っていうか、そんな自分で計算した値を使って、いったいなにがしたいのでしょうか?
もし、SJISでのバイト数を計算したいのなら、ワイド文字からMBCSに変換するなどしてから、バイト数を数えるほうが確実だと思います。
    • good
    • 0
この回答へのお礼

質問の通りにバイト数を取得したのです。
ご提示していただいた方法だと仰るとおり現実的でなく、且つそれしか方法がないのであれば、既に関数化されていそうですね。
wcstombs()を使用すれば、ワイド文字からマルチバイトへの変換、マルチバイトのバイトすうの取得が出来るようですので、先ずはこちらで試してみます。
ありがとうございました。

お礼日時:2008/10/17 13:17

とりあえずまだ誰も突っ込んでないのでひとつ。


error C2106: '=' : 左のオペランドが、左辺値になっていません。

QNo.4406429
からの続きでしょうか?
だとすれば、ひょっとして知りたいのはUTF-8のときのバイト数でしょうか?
もしそうなら、この質問だけではそんなこと分かりませんので、補足をお願いいたします。
(QNo.4406429の質問を見ていれば分からないこともないですが、検索で表示した場合は意味不明になりますし、質問者の名前を確認しない場合もあります。またページの切れ目で気づかないとかあるので、注意してください)

ところで、ワイド文字についての知識は十分でしょうか?
前回の質問の内容からあてずっぽうでコードを書いていませんか?

この回答への補足

エラーの件失礼しました。
QNo.4406429と同じ質問者です。
一つの枠に2つ以上の質問を書くのも解りづらいと思い別立てで質問させていただきました。

QNo.4406429の事を補足しますと、UTF-8で書かれたファイルをchar型で取得できず、エラーとなるといった質問でした。
こちらに関してはワイド文字列しか取得との回答を頂き解決しております。

ワイド文字に関する知識は充分とはいえない状況です。
自分なりに調べながら質問させていただいております。

補足日時:2008/10/17 09:28
    • good
    • 0

ワイド文字は大抵1文字2バイトです。


いわゆる全角文字・半角文字関係なく。
(サロゲートペアの文字は2バイト*2)

Shift_JIS(=CP932)であるときは、たまたま1バイト文字に半角文字と呼ばれるものが、
2バイト文字に全角文字と呼ばれるものが当てはまっていただけです。

このようなルールでよいのであれば、対象の文字列からShift_JISの1バイト文字以外の文字数分プラスすればいいです。
(Unicode→Shift_JISは情報がおちる可能性があるためやらないほうが無難。)
    • good
    • 0
この回答へのお礼

ありがとうございます。
つまりwcslen() * 2 +1 で計算出来るということですね。
ただ、半角は1バイト、全角は2バイトとして計算したいので、他の方法を考えてみます。

お礼日時:2008/10/17 09:14

単にワイド文字のバイト数を知りたいだけであれば、sizeof(wchar_t)とするだけです。



ワイド文字列のバイト数であれば、バイト数の数え方をまず定義してください。
すなわち、配列のバイト数なのか、ナルワイド文字を含まない文字列を構成するバイト数なのか、ナルワイド文字を含んだ文字列を構成するバイト数なのかです。

この回答への補足

バイト数に関してですが、「abcあいう」だった場合は9バイトとしてカウントしたいのです。

補足日時:2008/10/17 09:06
    • good
    • 0
この回答へのお礼

ありがとうございます。
sizeof(wchar_t)試してみます。

お礼日時:2008/10/17 09:07

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

QCStringからchar*への型変換について教えてください。

以前の質問に

int型 → CString型/char型

がありましたが、

CString型をchar*型に変換する方法を
教えていただければありがたいです。

MSDNで「LPCTSTRキャスト」が説明されていましたが、
例が載ってないのでよくわかりませんでした。

よろしくお願いします。

Aベストアンサー

目的にもよりますが一時的にchar配列として使いたいならCString::GetBuffer()が利用できます。
char配列としての利用が終わったらCString::ReleaseBuffer()する必要がありますが。

直接CString内の文字列を扱う必要があるならCString::operator LPCTSTRで文字列ポインタが得られます。
ただし、CStringオブジェクトをいじると無効ポインタなる可能性があるので気をつけてください。

MSDNのMicrosoft Foundation Classリファレンス→CString→クラスメンバで確認してください。

Qファイルやディレクトリの存在確認を行う方法

ファイルをオープンするのはfopenでOKですが、ファイルやディレクトリの存在確認を行う方法が知りたいです。

何か組み合わせて作るものなのでしょうか?
perlとか便利な演算子があるのですが、C/C++って器用ではないですね。
これは処理系?依存の内容ですか?

私の環境は VC6, VC2005 Windows2000です。

Aベストアンサー

int access(const char* path, int mode);
int stat(const char* path, struct stat* sb);

かな?
MSDN を引くと _access_s() を使えとか書いてあるけど。

QLNK2019: 未解決の外部シンボルのエラーが出る

Microsoft Visual Studio 2008
Version 9.0.21022.8 RTM
Microsoft .NET Framework
Version 3.5 SP1
----------------------------------------------------------------
新しいプリジェクト→Win32 コンソール アプリケーション(ソリューションのディレクトリを作成 チェック外す)→Windows アプリケーション(空のプロジェクト チェック外す)
----------------------------------------------------------------
 プログラム

 mymain.cpp
#include "myhelper.h"
#include "mymain.h"

//自キャラのデータ
Point2D g_jikipos = {40, 400};//自キャラの座標

//画像ハンドル
int g_jikiimage[11];

//色々なファイルの読み込み
int LoadFiles(){
//画像ファイル読み込み
if(LoadDivGraph("media\\player01.bmp",
11,11,1,64,64,g_jikiimage) == -1) return -1;

return 1;
}


 mymain.h
//他から呼び出させるMyMainの関数
void MyMain();
int LoadFiles();


 myhelper.h(サンプルなので打ちミスはない)
#include "DxLib.h"
#include <limits.h>
#include <math.h>

//構造体宣言
//座標またはベクトルを記録する構造体
struct Vector{
float x,y;
};
typedef Vector Point2D;
//線を記録する構造体
struct Line2D{
Point2D startpos, endpos;
float katamuki;//傾きをラジアン値で記録
Vector speed;//移動している場合は速度をセット
};
//球体を記録する構造体
struct Ball2D{
Point2D position;
float hankei;//半径
};
//四角形を記録する構造体
struct Rect2D{
Point2D lefttop;
Point2D rightbottom;
float width;
float height;
};


//ライブラリ関数
Point2D PosInView(Point2D in);
int XInView(float inx);
int YInView(float iny);
void ScrollToLeft(float jikiposx);
void ScrollToRight(float jikiposx);
void ScrollToUp(float jikiposy);
void ScrollToDown(float jikiposy);
void DrawLineInView(float x1, float y1, float x2, float y2, int Color, int Thickness);
void DrawCircleInView(float x, float y, float r, int Color, int FillFlag);
void DrawAnimation(float x, float y, double ExtRate, double Angle,int TurnFlag,
int *imgarray, int allframe, float fps);
//ベクトル関数
Vector CreateVector(Vector in, float veclen);
Vector AddVector(Vector v1, Vector v2);
Vector SubVector(Vector v1, Vector v2);
Vector AddVectorInFrameTime(Vector pos, Vector speed);
Vector AddVectorInFrameTime2(Vector pos, Vector speed, Vector accel);
Vector Normalize(Vector in);
Vector RotateVector(Vector in, float radian);
float VectorLengthSquare(Vector in);
float DotProduct(Vector v1, Vector v2);
float CrossProduct(Vector v1, Vector v2);
void SetLine2DKatamuki(Line2D *in);
void DrawLine2D(Line2D in, int Color, int Thickness);
void DrawBall2D(Ball2D in, int Color, int Fill);
//当たり判定関数
bool HitTestLineAndBall(Line2D linein, Ball2D ballin);
bool IsPointAtLineFace(Line2D linein, Point2D ptin);
bool HitTestLineAndLine(Line2D line1, Line2D line2);
bool HitTestBallAndBall(Ball2D a, Ball2D b);
bool HitTestPointAndBox(Rect2D rect, Point2D pt);
//タイマー関数
void SetSimpleTimer(int idx, int time);
int GetPassedTime(int idx);


//グローバル変数
extern float g_frametime;
extern Rect2D g_framerect;//画面領域(当たり判定)
extern Point2D g_current_field_pos;//現在の左上座標
extern Rect2D g_stagesize;//ステージサイズ

//定数宣言
const float ZEROVALUE = 1e-10f;
const float PIE = 3.1415926f;
const int SCROLL_LIMIT = 200;
----------------------------------------------------------------
 エラー内容
1>myhelper.obj : error LNK2019: 未解決の外部シンボル "void __cdecl MyMain(void)" (?MyMain@@YAXXZ) が関数 _WinMain@16 で参照されました
1>C:\Documents and Settings\Owner\My Documents\Visual Studio 2008\Projects\my\Debug\my.exe : fatal error LNK1120: 外部参照 1 が未解決です
1>my - エラー 2、警告 0
ビルド: 0 正常終了、1 失敗、0 更新不要、0 スキップ
----------------------------------------------------------------
画像を貼り付けときます
(見えにくい場合→http://www.dotup.org/uploda/www.dotup.org154142.jpg.html)
初心者なのでわかりやすくお願いします

Microsoft Visual Studio 2008
Version 9.0.21022.8 RTM
Microsoft .NET Framework
Version 3.5 SP1
----------------------------------------------------------------
新しいプリジェクト→Win32 コンソール アプリケーション(ソリューションのディレクトリを作成 チェック外す)→Windows アプリケーション(空のプロジェクト チェック外す)
----------------------------------------------------------------
 プログラム

 mymain.cpp
#include "myhelper.h"
#include "mymain.h"

//自...続きを読む

Aベストアンサー

ファイル構成から推測するに
mymain.cpp というファイルに
void MyMain(void) {
// ここに処理を書く
}
という関数が必要なようです。

QDWORDの実際の型は何でしょうか

VC++.NETの環境です。
DOWRD dw1 = 1;
int i = 2; と定義し
ここで
if ( i > dw1 ){
何かの処理;
}
とコーディングすると
warning C4018: '>' : signed と unsigned の数値を比較しようとしました。
のワーニングがでます。
これは、DWORDがint型でなくunsigned int型のようにも見えます。
ある本によれば(VC++.V.NET逆引き大全500の極意)
DWORD はint型であると記述されています。
もし、int型ならこのワーニングはでないはずなのですが、
なぜでるのでしょうか。又、DWORDの実際の型は何なのでしょうか。ご存じのかたおりましたら、教えていただけませんでしょうか。

Aベストアンサー

型定義が知りたいのならば、宣言ファイルを見れば疑問を挟む余地もありません。
DWORD型はwindef.hで
"typedef unsigned long DWORD;"
と宣言されています。

Visual Studioを使っているのならば、知りたい型の上にマウスポインタを置いて右クリック、ポップアップメニューの「定義へ移動」または「宣言へ移動」で簡単に知ることが出来ます。

Qint型からchar型への変換

タイトル通り、int型からchar型への変換の仕方がわかりません!><
どうしたらいいのでしょうか?

Aベストアンサー

#include <stdio.h>


char buf[5];
int no;

no = 10;
sprintf(buf, "%d", no);

QLPCWSTRとchar

質問なのです・・・

現在、私は[Visual Stdio.Net 2005]を使って、C++のプログラミングをしようと思いまして、今日参考書を見てやってみたのですが、

charの配列を使って、文字列を格納しそれを使おうとしたら、LPCWSTRのキャストが必要というエラーがでました。
参考書だと普通に通るらしいのですが・・・Visual Stdio.Net 2003と2005の違いなのでしょか?わかる方教えていただけませんでしょうか??

Aベストアンサー

補足です。
2005デフォルトのUNICODEを変更する方法は
プロジェクト->プロパティ->構成プロパティ->全般 の中にある
文字セットを[Unicode 文字セットを使用する]から[マルチバイト文字セットを使用する]
に変更することで可能です。

QCString から LPCTSTRの型に変換

visual studio 2013 VC++を使用していますが、WINDOWSの関数に渡すためにCString からLPCTSTRに変換する必要があります。実際にどのようにするのかわかりません。
例えば、以下のサンプルは他の質問コーナーの回答をアレンジしたものです

CString str = _T("ABC");
int siz = str.GetLength()+1;
LPCTSTR pszFName = new TCHAR[siz];
_tcscpy_s( pszFName, siz, str );

で変換するのですが
LPCTSTRからwchar_t*へ変換できませんとエラーがでます
_tcscpy_s()は使用できないのでしょうか

Aベストアンサー

>APIはCStdioFile の Open()でファイル名を与えるところ

APIではないようですが……。

http://msdn.microsoft.com/ja-jp/library/ee247566.aspx
ならば、そのままCStringの変数渡せば、よろしく処理してくれると思いますけど。

Qfgetsで拾われる改行文字を削除したい

お世話になります

 C言語初心者のものです。今課題でC言語を用いたプログラミングを
Fedora上でやっています。問題は、fgetsでテキストファイルから、取得
した文字列の中から改行文字を削除できないことです。文字変数のアド
レスはわかっているのですが、終端文字に置換しようとすると、セグメ
ントエラーになってしまいます。これは如何にして解決すべきでしょう
か。よろしくお願いします。

Aベストアンサー

ポインタとかアドレスとか、C言語の用語としてあるものを別の意味に使うとまぎらわしいです。

「ポインタ」「アドレス」と言われたら、 この例なら str, str+i が思い浮びます。
「文字変数のアドレス」だと
char c ;
に対しての
&c
が思い浮びます。

配列なら「添字」、意味的には「x文字目」ですね。

> for(i=0;;i++){
> if(*(str+i)=='/n') {
> *(str+i)='\0';
> break;
> }
> }
/nが\nの間違いなら、この方法で半分正解です。もう少し広い範囲(可能なら全体)で見ないことにはなんとも言えません。
fgetsが最大文字数に達したり、ファイルの最後になったりで、strに改行文字が含まれない場合には、このループは止まりません(Segmentension Falutになって止まる)

・そのような状態になってないか、予めチェックする
・ループを終了させる仕組みを用意しておく
: forの終了条件を記述する、for中で if(*(str+i)=='\0') { break;} 等としておく、等
といった対策が必要です。


あと細かいところを言えば
・strを配列で用意したなら *(s+i)じゃなくてs[i]でいいんじゃないかな
・あるいは char *pみたいにしておいて、 iのループでなく pでループを組む( for(p=str;*p!='\0';p++) )とか。

ポインタとかアドレスとか、C言語の用語としてあるものを別の意味に使うとまぎらわしいです。

「ポインタ」「アドレス」と言われたら、 この例なら str, str+i が思い浮びます。
「文字変数のアドレス」だと
char c ;
に対しての
&c
が思い浮びます。

配列なら「添字」、意味的には「x文字目」ですね。

> for(i=0;;i++){
> if(*(str+i)=='/n') {
> *(str+i)='\0';
> break;
> }
> }
/nが\nの間違いなら、この方法で半分正解です。もう少し広い範囲(可能なら全体)で見ないことにはなんとも言えません。
fgetsが...続きを読む

QCStringの文字列検索&抜き出しについて

お世話になります。
///////////開発環境///////////
WinXP VisualStudio 2005 SDI MFC

以上の環境にてプログラムしています。

現在CString型の変数の中にある文字列操作について悩んでいます。

例えば、 CString Test(:program!~program@123.456 TEST :message);

このような内容が入ってるとします。
こんな時に例えばTESTを抜き出したい時にどうすればいいでしょうか?
なお、毎回TESTという文字列ではなくTEST2などの文字列が変わるもの
だとするとバイト数指定が出来なくて困っています。
バイト数指定しないでTESTのTのアドレスをGETしてそれを'\0'までを
切り抜くと:messageの部分まで取れてしまいます。
でもバイト指定が可変なので、出来ない・・。どうすればいいのでしょうか??
同様にmessageの部分も毎回変わっていてバイト数指定出来ません。
こちらの方は、文字列の最後から:を探していって:が見つかったらその
アドレスから'\0'までを切り出せばいいと思うのですが、もし
messageの部分に:mess:ageこういうメッセージが送られて来た時に、
:ageしか取れなくなり、本当はmess:ageを切り抜きたいのです。
せっかくMFCのCStringを使っているので、strtokやstr~などのC言語関数
は避けたいのですが、何かいい案ありますでしょうか??
ご教示宜しくお願いいたします。

お世話になります。
///////////開発環境///////////
WinXP VisualStudio 2005 SDI MFC

以上の環境にてプログラムしています。

現在CString型の変数の中にある文字列操作について悩んでいます。

例えば、 CString Test(:program!~program@123.456 TEST :message);

このような内容が入ってるとします。
こんな時に例えばTESTを抜き出したい時にどうすればいいでしょうか?
なお、毎回TESTという文字列ではなくTEST2などの文字列が変わるもの
だとするとバイト数指定が出来なくて困っています。
...続きを読む

Aベストアンサー

CStringクラスの持っているメソッドのFind と Mid を使う。

CStringT のメンバ (ATL/MFC)
http://msdn2.microsoft.com/ja-jp/library/abzc9989(VS.80).aspx
CStringT::Find (ATL/MFC)
http://msdn2.microsoft.com/ja-jp/library/hz2099kw(VS.80).aspx
CStringT::Mid (ATL/MFC)
http://msdn2.microsoft.com/ja-jp/library/b4c90k3d(VS.80).aspx

Qfatal error LNK1120: 外部参照 1 が未解決です

またわからないことが・・・
教えて下さい。
以下をVC++2005でコンパイルすると、

MSVCRTD.lib(crtexew.obj) : error LNK2019: 未解決の外部シンボル _WinMain@16 が関数 ___tmainCRTStartup で参照されました。
C:\Documents and Settings\tomato\My Documents\Visual Studio 2005\Projects\a\Debug\a.exe : fatal error LNK1120: 外部参照 1 が未解決です。

と警告がでて通りません。
何のことでしょうか。

#include<stdio.h>
#include<process.h>

struct meibo{
  char name[20];
  char tel[20];
  char address[20];
};

void message( void );
void input( FILE *fp, int cnt , struct meibo *a, int *end );

void main( void )
{
  struct meibo a[20];
  FILE *fp;
  int cnt, end;

  if( (fp=fopen( "meibo.dat", "w" ) ) == NULL ){
    printf( "Can not open the meibo.dat.\n" );
    exit( 1 );
  }

  message();

  fprintf( fp, "番号, 名前, TEL, 住所\n" );
  fflush( fp );

  cnt = 0;
  end = 0;
  while( end == 0 ){
    input( fp, cnt, &a[cnt], &end );
    cnt++;
    fflush( fp );
    if( cnt == 20 ){
      printf( "人数が一杯です.終了します.\n" );
      end = 1;
    }
  }
  fclose( fp );
}

void message( void )
{
  printf( "名前, TEL, 住所, endを入力してください.\n" );
  printf( "継続の時はend=0," );
  printf( "中止の時は,end=1と入力してください.\n" );
}

void input( FILE *fp, int cnt, struct meibo *a, int *end )
{
  printf( "名前-->" );
  scanf( "%s", a->name );
  printf( "TEL -->" );
  scanf( "%s", a->tel );
  printf( "住所-->" );
  scanf( "%s", a->address );
  printf( "Exit? Continue:0 Exit:1 -->" );
  scanf( "%d", end );
  printf( "\n" );
  fprintf( fp, "%2d, %s, %s, %s\n",
    cnt+1, a->name, a->tel, a->address );
}

またわからないことが・・・
教えて下さい。
以下をVC++2005でコンパイルすると、

MSVCRTD.lib(crtexew.obj) : error LNK2019: 未解決の外部シンボル _WinMain@16 が関数 ___tmainCRTStartup で参照されました。
C:\Documents and Settings\tomato\My Documents\Visual Studio 2005\Projects\a\Debug\a.exe : fatal error LNK1120: 外部参照 1 が未解決です。

と警告がでて通りません。
何のことでしょうか。

#include<stdio.h>
#include<process.h>

struct meibo{
  char name[20];
...続きを読む

Aベストアンサー

http://www.a.math.ryukoku.ac.jp/~hig/course/compsci2_2005/man/faq.html
にある現象と同じではないでしょうか、一度お試しください。


人気Q&Aランキング