文字列

Question

お世話になります。最近文字列を勉強し始めたのですが、文字列になるとてんでダメになってしまいます・・・。お聞きしたいことは２つあります。

1.テキストファイルから英単語を読み込み、それらをアルファベット順に並べ、新たにテキストファイルに書き込むというものです。例えば、
january
February
march
April
Apple
と読み込んだなら、
Apple
April
February
january
march
と書き込みたいのです。文字列を配列に格納し、一文字一文字比較していきたいのですが、文字だとどのように比較して順番を変えればよいのでしょうか。数字の比較なら簡単に出来るんですが、文字だとわからなくなってしまいます。

2.これも同じく文字なのですが、テキストファイルから英単語、あるいは英語のフレーズを２つ読み込み、その２つの英語がアナグラムかどうかを判定するものです。
アナグラム→http://d.hatena.ne.jp/keyword/%A5%A2%A5ʥ%B0%A5%E9%A5%E0
例えば、「O, Draconian devil！」と「Leonardo da Vinci！」を読み込んでアナグラムか判定します。ちなみにこれはアナグラムです。これも一文字一文字比較していくと思うのですが、どのように比較すれればよいのかがわかりません。どなたか宜しくお願い致します。

yaemon_2006 · Accepted Answer

#include #include #include #include int isanagram1(char *str1, char *str2) { int c1[256] = {0}, c2[256] = {0}, i; while(*str1) c1[tolower(*str1 ++)] ++; while(*str2) c2[tolower(*str2 ++)] ++; for(i = 0; i < 256; i ++){ if(isalpha(i) && (c1[i] != c2[i])) return 0; } return 1; } void selectalpha(char *str) { char *c0, *c1; for(c0 = c1 = str; *c0 = tolower(*c1); c1 ++) c0 += (isalpha(*c0) != 0); } void count(char *str, int *c) { char *al = "abcdefghijklmnopqrstuvwxyz", *p; selectalpha(str); while(*str){ if((p = strchr(al, *str ++)) != NULL) c[p - al] ++; } } int isanagram2(char *str1, char *str2) { int c1[26] = {0}, c2[26] = {0}, i; count(str1, c1); count(str2, c2); for(i = 0; i < 26; i ++){ if(c1[i] != c2[i]) return 0; } return 1; } int compc(const void *c1, const void *c2) { return *(char *)c1 - *(char *)c2; } int isanagram3(char *str1, char *str2) { selectalpha(str1); selectalpha(str2); qsort(str1, strlen(str1), sizeof(char), compc); qsort(str2, strlen(str2), sizeof(char), compc); return !strcmp(str1, str2); } int main(void) { char str1[32] = "O, Draconian devil!"; char str2[32] = "Leonardo da Vinci!"; char *result[2] = {"Not Anatram", "Anagram"}; puts(str1); puts(str2); printf("%s ", result[isanagram1(str1, str2)]); puts(str1); puts(str2); printf("%s ", result[isanagram2(str1, str2)]); puts(str1); puts(str2); printf("%s ", result[isanagram3(str1, str2)]); puts(str1); puts(str2); return 0; }

yaemon_2006 · Answer

1、strcmp

　2、それぞれの文字数を比較

Tasuke22 · Answer

文字列の比較の仕方ですね。

strcmp などの関数を使うと大小関係が得られます。
a<b<・・・<z です。アスキーコードだったら
a=31 b=32 となっています。

御自分で比較する場合は、文字として比較します。

str1[0] < str2[0]

といった具合ですが、文字列の数だけ行う必要が
あります。

asuncion · Answer

> 「O, Draconian devil！」と「Leonardo da Vinci！」

双方の文字列をそれぞれ昇順または降順に並べ替えます。
並べ替えた文字列を、先頭から1文字ずつ比べていきます。
途中に食い違いがあればアナグラムではありません。
最後まで同じであればアナグラムです。

yama5140 · Answer

★１．は文字列群を昇順にソートし、ソート結果をファイル出力。

　・ソートでは strcmp() を用いる（戻り値、正負で大小判定）。
----------------------------------------------
☆質問者様の２．における例文字列、

　「O, Draconian devil！」と
　「Leonardo da Vinci！」を見ると、
　
　 , が一方のみに使われ、文字列長が異なる。
　　（プロポーショナルでの見かけの文字列長調整？）。

　ことから、２つの文字列内をソートし、結果どうしを「比較」する方法では難しいと思います。

★大文字・小文字を同じとして、２６文字種の使用数をカウントし、
　双方の使用数が同じかどうかで判定すれば、と思います。

　a と A の使用数が iCnt[0] に入ります（◆）。

　char　cDevil[32], cVinci[32];
　int　iCnt[26] = { 0 }, iCode, i;

　for( i = 0; i < 32; i++ ){　// cDevil

　　if( 0x00 == cDevil[i] )　break;　// 文字列終わり

　　if( 0 == isalpha( cDevil[i] ) )　continue;　// 「英文字」判定

　　iCode = toupper( cDevil[i] ) - 0x41;　// 大文字化（◆）

　　iCnt[ iCode ]++;　// 加算
　}
　for( i = 0; i < 32; i++ ){　// cVinci

　　if( 0x00 == cVinci[i] )　break;

　　if( 0 == isalpha( cVinci[i] ) )　continue;

　　iCode = toupper( cVinci[i] ) - 0x41;

　　iCnt[ iCode ]--;　// 減算
　}
　for( i = 0; i < 26; i++ ){　// アナグラム判定
　
　　if( 0 == iCnt[i] )　continue;

　　printf( "アナグラムではありません
" );

　　break;
　}
注：インデントに全角空白を用いています。

参考URL：http://e-words.jp/p/r-ascii.html

yama5140 · Answer

No4 です。

＞私は配列をs[256]と1つだけ用意し、
＞テキストファイルから読み込んでいるのですが

テキストファイルが、
january
February
march
April
Apple
のようになっていると s[256] には最後の Apple だけが入り、
それ以前の行（レコード）のデータは上書きされてしまいます。
（まさか連結なんかしてないよね？←複雑そう）

★次のように、格納してからでないと・・・。

char　cBuf[256], cStore[GYO][256];

while( NULL != fgets( cBuf, 256, fp ) ){

　strcpy( cStore[iLine++], cBuf ); // 格納
}
・
（ソート）
if( 0 < strcmp( cStore[i], cStore[j] ) ){
（入れ替え（別の配列に待避などで））
}
（出力）
☆ソートについては、検索すればいっぱい出てきます。
--------------------------------------------------
★前回の回答で、関数化できる部分がありました。

　・
Count26( cDevil, iCnt, 1 ); // 関数呼び出し
Count26( cVinci, iCnt, -1 );
　・
}
void　Count26( char cWork[], int iCnt[], int iAdd )
{
　int　i, iCode;

　for( i = 0; i < 32; i++ ){

　　if( 0x00 == cWork[i] )　break;　// 文字列終わり

　　if( 0 == isalpha( cWork[i] ) )　continue;　// 「英文字」判定

　　iCode = toupper( cWork[i] ) - 0x41;　// 大文字化にして

　　iCnt[ iCode ] += iAdd;　// 加減
　}
}

asuncion · Answer

> 「O, Draconian devil」のようにスペースを入れると、cDevilにO,が、cVinciにDraconianが入ってしまい、セグメンテーションエラーを起こしてしまいました。
> 私のこのやり方はまずかったでしょうか・・・？

scnaf()を使うと、スペースを受け取った時点で、例えばcDevilへの
入力を終了したものとみなします。
別の関数、例えばfgets()あたりを使ってみてはいかがでしょうか。

> 例えば単純に、erosとroseを入力してもアナグラムではないと表示されます。

どういったコードでですか？

> と、Count26が2つあるからでしょうか。

何をしたときに矛盾と出たのでしょうか？
行なったこととエラーメッセージを正確に教えてください。
なお、どの関数を何回呼び出しても全く問題ありません。

asuncion · Answer

> fgetsはファイルを読み込むための関数でしたよね

fgets()の第3引数にstdinを指定すれば、標準入力（例：キーボード）からの
入力を受け取れます。

asuncion · Answer

> この方法を調べても、2つ以上の文字列を昇順にする方法（私の1つ目の質問のような）は沢山見つかるのですが、
> 1つの文字列を昇順にする方法が見つかりません。

ソートなどのアルゴリズムについて解説している書籍で
勉強なさることを強くおすすめします。

yama5140 · Answer

No4, 5 です。＞1つ目のプログラムは出来ました。皆様ありがとうございました！よかったですね、「ソート」は一度習得すれば、あとは応用ですから。 ------------------------------------------------- ＞No.3 様が以前ご指摘されたように、まずO, Draconian devil!を＞昇順に並べ替え、次にLeonardo da Vinci!を同じく昇順に並べ替＞えようとしたのですが・・（投稿者一部修正） ★No4 で記しましたように、この方法では難しいと思います。＞それと、比較はcase-insensitiveなので大文字小文字は区別しません。 ★このことの処理を、「昇順に並べ替え」る前にしないといけませんね。 ------------------------------------------------- ＞1つの文字列を昇順にする方法が見つかりません。 ★以降に示します（「丸投げ」返球ですが、この方法では本来の目的が叶えられないことを示すため、ソース全文を投稿します）。 #include #include void　Sort32( char cWork[] ) { 　int　i, j, iLen; 　char　cDummy; 　iLen = strlen( cWork ); 　for( i = 0; i < iLen; i++ ){ 　　for( j = i; j < iLen; j++ ){ 　　　if( cWork[i] < cWork[j] )　continue; 　　　cDummy = cWork[i]; 　　　cWork[i] = cWork[j]; 　　　cWork[j] = cDummy; 　　} 　} } void　main() { 　char　cDevil[32] = "O, Draconian devil!"; 　char　cVinci[32] = "Leonardo da Vinci!"; 　Sort32( cDevil ); 　Sort32( cVinci ); 　printf( "%s ", cDevil ); 　printf( "%s ", cVinci ); } 注：インデントに全角空白を用いています（タブに一括変換して下さい）。 ☆実行すると、「__!,DOaacdeiilnnorv」「__!LVaacddeiinnoor」　となります。（投稿表示のため、半角スペースの代わりに _ を使用） No.3 さんの＞並べ替えた文字列を、先頭から1文字ずつ比べていきます。 ★↑難しいどころか、できないですよね。 ★「並べ替え」方式でなく、「２６文字種の使用数をカウント」方式を　お勧めします（ case-insensitive 対応）。　これですと、例のように文字列長が異なる場合にも使えます。

文字列

文字列の比較の仕方ですね。

> 「O, Draconian devil！」と「Leonardo da Vinci！」

★１．は文字列群を昇順にソートし、ソート結果をファイル出力。

この回答への補足

No4 です。

この回答への補足

> 「O, Draconian devil」のようにスペースを入れると、cDevilにO,が、cVinciにDraconianが入ってしまい、セグメンテーションエラーを起こしてしまいました。

この回答への補足

> fgetsはファイルを読み込むための関数でしたよね

> この方法を調べても、2つ以上の文字列を昇順にする方法（私の1つ目の質問のような）は沢山見つかるのですが、

No4, 5 です。

#include <stdio.h>

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング