
文字の容量(サイズ)についての質問です。
掲示板を作る際には文章を書く必要があります。
逆に、投稿する場合もあたりまえですが、文を書きます。
何も掲示板に限ったことではないのですが・・。
先方、ここでは掲示板を作る元の会社(例えばteacupなど)から
文字を書く上で○KB以内で、という指定が出てきます。
この今書いている文章が何キロバイトかどうかを
はかる手段を教えていただきたいのです。
全体としてのサイズはプロパティでわかります。
文章からみたサイズを調べたいのです。
例えば、「おはようございます」は何キロバイトなのか?なのです。
1KB=1000B。1文字は1バイト。「おはようございます」は9バイト。
「お早う御座います」だとしたら、11バイトかな?
ここでの質問として、写真などの画像は除いていただいてけっこうです。
調べたところによると、一般的には、
1KBは約1000Bなので、半角だと1000文字、全角だと500文字らしいですが・・。
リンクをする場合、英字が登場しますので、
これは半角と思いますので、1文字=1バイトかと思いますが・・。
スペースは?
書いた文字について、容量を調べる方法を
ご教授の程、よろしくお願い致します。
No.3ベストアンサー
- 回答日時:
1バイトは「半角」1文字を表す大きさです。
いわゆる、半角英数と、スペース等の一部記号、改行文字などの制御文字が該当します。
正確なものは以下を参考に
http://ja.wikipedia.org/wiki/ASCII
「全角文字」の場合は、1文字は複数バイトになります。何バイトかは、文字コードによって違います
Shift_JIS,EUC-JPの場合は2バイトです。
「helloおはようございます」は5文字x1バイト+9文字x2バイト=23バイトになります。
ISO-2022-JP(いわゆるJIS)の場合、1文字=2バイトに加えて、半角文字との境に3バイトずつ、切り替え制御文字列が入ります
「helloおはようございます」は 5文字x1バイト+漢字用切り替え3バイト+9文字x2バイト+英数切り替え3バイト=29バイトになります。
UTF-8では1文字=3バイトです。
「helloおはようございます」は5文字x1バイト+9文字x3バイト=32バイトになります。
スペースや英数字も、「全角」ならば上の「全角」に従い複数バイト文字になります。
「半角カタカナ」は扱いがややこしく、Shift_JISでは1バイトですが、EUC-JPでは2バイト、UTF-8では3バイトになります。
また、UTF-16では、「半角英数」でも2バイト使います。
調べ方ですが
・文字数を数えて、上の法則に従って手計算。改行文字のことも忘れずに。
・文字数を数えて、全部全角だと考えて2倍(または3倍)
・Javascriptを使ってtextareaの文字数を数えて表示するスクリプトを作る。
例えば、教えて!gooでは、この回答を書いているときに、下に「あとXXX文字入力できます」と表示されています。
・書いた内容をコピーして、メモ帳等のテキストエディタに貼り付けて保存して、そのファイルサイズを調べる。
等となります。
ただ、これが掲示板のバイト数とは一致しないケースもありえます。
(URLがあったら<A HREF=~>と変換した上で数えている、等)
この回答への補足
早速のご回答をありがとうございます。
深く突っ込んでのご回答は嬉しく思っております。
ん~、な~るほど・・
調べ方の部分ですが、
文字数が少ない時には、手作業でも良いのでしょうが、
多くなってくると厳しいです。
そこで
おっしゃるとおり、メモ帳で保存して試してみました。
あと、MS WORD でも試してみました。WORDもテキスト文書と思ったので・・。
メモ帳ではほぼ正確に出ました。
このメモ帳・・利用という方法で調べていきたいと現状思っております。
MS WORD ではダメなんですね。容量が大きくなって表示されていました。
先方の会社(teacup掲示板でもブログでも何でもよいのですが)の
「○○KB以内で」と指定があるとなると、この容量の把握で頭を悩ませていたもので、
ほっとするやら嬉しいやらで
ありがとうございました。
No.4
- 回答日時:
一番簡単な方法として、
テキストファイルにして保存すれば容量が判ります。
この回答への補足
早速のご回答をありがとうございます。
テキストファイルにして保存で容量を調べる・・。
MS WORDはテキスト文書だと思って試してみましたが、
docxがタイトル文字の後に付き、ダメなんですね。容量表示が大きくなってしまった。
メモ帳だと、txtがタイトル文字の後に付き、うまく調べることができました。
結論ですね。
ありがとうございました。
嬉しいです。
No.2
- 回答日時:
S-JISやANISなら半角文字は1バイト、全角文字は2バイト。
スペースにも半角・全角があります。UNICODEなら半角も全角も2バイトのはず。
それから1KBは1024Byteです(2の10乗バイト)。
「おはようございます」は全角9文字なので18バイト。
「お早う御座います」は全角8文字なので16バイト。
どちらも全角文字ですからね。
高機能テキストエディタには文字数をカウントできるモノがあります。
秀丸とかサクラエディタとか。
この回答への補足
早速のご回答をありがとうございます。
基本的部分から、さらに突っ込んでのご回答は
嬉しく思っています。
高機能テキストエディタ・秀丸(名前程度は聞いたことがありましたが)とか
サクラエディタも新しく知りました。
感謝致します。
No.1
- 回答日時:
単に文字のバイトだけであれば
大文字小文字もありますが 日本語はほとんど全角表示で2バイトです
ひらがなも2バイトです
1バイトは8ビットで表す 2バイトは16ビットで表します
表示させる時は8ドット*8ドットが半角文字に相当します
16ドット*16ドットが全角文字に相当します
この回答への補足
早速のご回答をありがとうございます。
ひらがなも2バイトとは知らなかったです。
漢字は2バイトは知っていましたが・・。
ありがとうございました。
助かりました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Visual Basic(VBA) 特定の文字を簡単な操作で半角スペースに変換するか削除したい 2 2022/11/01 10:35
- Excel(エクセル) エクセルの数式で教えてください。 3 2022/10/25 10:52
- Excel(エクセル) エクセルの数式で教えてください。 2 2023/03/09 16:55
- Excel(エクセル) capeofdragonと申します Excel2016を使っておりまして 半角又は全角の任意文字列が 2 2022/10/31 13:51
- ヤフオク! ヤフオクに出品したいのですが、タグを実行出来ません。 2 2022/09/16 12:36
- 哲学 説得力を論理の強さまたは修辞の巧みさの2つに分析するにはどうすると良いでしょうか? 2 2022/06/27 05:51
- Visual Basic(VBA) エクセルの数式で教えてください。 1 2023/07/31 15:49
- その他(プログラミング・Web制作) プログラミング pythonの問題について 2 2022/04/19 00:41
- Illustrator(イラストレーター) イラストレーターで文字の背景に自動で入れた長方形の左側の角だけ丸く(右側だけ直角に)する方法 4 2023/04/21 11:08
- Word(ワード) Windows11キーボードの調子が悪いので治し方を教えてください。 【症状】 1つ目 キーボードの 5 2022/07/03 14:51
このQ&Aを見た人はこんなQ&Aも見ています
関連するカテゴリからQ&Aを探す
今、見られている記事はコレ!
-
専門家に聞いた!コロナ禍でも上手にデジタルデトックスを取り入れる方法
一定期間、PCやスマホなどの使用を控えることを意味する「デジタルデトックス」を皆さんは実践しているだろうか。テレワークやオンライン授業など、デジタル技術によりさまざまな不便が解消されているコロナ禍では、...
-
エルフ田さん:第45話「ながら視聴」
-
弁護士が語る「合法と違法を分けるオンラインカジノのシンプルな線引き」
「お金を賭けたら違法です」ーーこう答えたのは富士見坂法律事務所の井上義之弁護士。オンラインカジノが違法となるかどうかの基準は、このように非常にシンプルである。しかし2025年にはいって、違法賭博事件が相次...
-
釣りと密漁の違いは?知らなかったでは済まされない?事前にできることは?
知らなかったでは済まされないのが法律の世界であるが、全てを知ってから何かをするには少々手間がかかるし、最悪始めることすらできずに終わってしまうこともあり得る。教えてgooでも「釣りと密漁の境目はどこです...
-
カスハラとクレームの違いは?カスハラの法的責任は?企業がとるべき対応は?
東京都が、客からの迷惑行為などを称した「カスタマーハラスメント」、いわゆる「カスハラ」の防止を目的とした条例を、全国で初めて成立させた。条例に罰則はなく、2025年4月1日から施行される。 この動きは自治体...
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
携帯電話の略語であるMBって英...
-
文字の容量(サイズ)についての...
-
JIS、SHIFT-JIS、EUCはなぜでき...
-
TMPGEnc Authoring Works 4
-
Stirlingについて
-
メモリの単位について
-
CSV データのバイト数を調べる...
-
Windows・Linuxのバイナリコー...
-
新聞1ページは何バイトですか?...
-
K KB MB について詳し...
-
実行計画の「COST」と「BYTE」...
-
【有効数字について】 授業で、...
-
16bitはダイナミックレンジが97...
-
プログラム言語FortranとCの違...
-
有効数字の計算
-
エクセルでビット1をカウント J...
-
6ビット(符号含む)の二進数
-
次の加算(2進数4ビット)でオ...
-
VBAでのコントロール操作
-
【エクセル】四捨五入・二捨三...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
携帯電話の略語であるMBって英...
-
EXCELでの16進数取り出し、上...
-
1Mバイトって何バイト?
-
実行計画の「COST」と「BYTE」...
-
文字の容量(サイズ)についての...
-
GB と Gbの違いの意味
-
Excel_VBAで改行コードの無いフ...
-
CSV データのバイト数を調べる...
-
2バイト文字を一括削除するマクロ
-
KBのMB違いって
-
アルファベット30文字は何バイ...
-
KとKB
-
おねがいします。
-
16進数どうしの乗算
-
メモリーの単位を解説してくだ...
-
32bit = 4GB(バイト)?
-
K KB MB について詳し...
-
KBとMB
-
1バイトは何ビット?
-
ffftpのサイズの単位は何でしょ...
おすすめ情報