Unicode規定の Zs (space separator) とは
ECMA262 Edition 5 規定の String.prototype.trim() を未対応ブラウザ用に実装しようとしています。
仕様には「WhiteSpace, LineTerminator を取り除く」との記述がありました。
-------
15.5.4.20 String.prototype.trim()
...(中略)...
3. Let T be a String value that is a copy of S with both leading and trailing white space removed. The definition of white space is the union of WhiteSpace and LineTerminator.
http://www.ecma-international.org/publications/s …
-------
WhiteSpace, LineTerminator はそれぞれ「7.2 White Space」「7.3 Line Terminators」で定義されており、概ね理解しましたが、WhiteSpaceで定義されている「Zs」の文字が何であるか、で詰まりました。
Zs は表で記述されていますが、該当部だけ引用すると次のように書かれています。
(表をテキストで書くのは難しいのでフォーマットを変えています)
-------
7.2 White Space
...(中略)...
[Code Unit Value] Other category "Zs"
[Name] Any other Unicode "space separator"
[Formal Name] <USP>
ECMAScript implementations must recognize all of the white space characters defined in Unicode 3.0.
Later editions of the Unicode Standard may define other white space characters.
ECMAScript implementations may recognize white space characters from later edition of the Unicode Standard.
http://www.ecma-international.org/publications/s …
-------
機械翻訳を頼りに翻訳してみたところでは、「Unicode 3.0 定義の空白文字」と「最新の Unicode 定義の空白文字」を認識しなければならない、と読めました。
Unicode Consortium
http://www.unicode.org/
公式サイトらしき場所は発見しましたが、ここからどこを読めば Zs (space separator) が確認できるのか、がわかりません…。
(ぐぐってみると、それらしき情報がHITするのですが、できれば公式文書で確認したいと思っています。)
JavaScript, Regex, and Unicode
http://blog.stevenlevithan.com/archives/javascri …
Unicode Characters in the 'Separator, Space' Category
http://www.fileformat.info/info/unicode/category …
unicode.org のどこに Zs (space separator) に関する記述があるのでしょうか?
# 英語サイトに関する質問なので [英語] カテゴリにすべきか迷いましたが、内容は専門的な事なので [JavaScript] カテゴリとしました。
# 問題があるようでしたら、別の形で再質問したいと思います。
No.1ベストアンサー
- 回答日時:
カテゴリ Zs は早いはなしが「空白文字」のようですね (
http://www.unicode.org/versions/Unicode5.2.0/ch0 … ). どの文字が Zs であるかはプロパティリスト (http://www.unicode.org/Public/5.2.0/ucd/PropList … ) を探せば書いてあったりします.参考URL:http://www.unicode.org/Public/5.2.0/ucd/PropList …
ありがとうございます。
英語への苦手意識がまだ抜けていないようで、とても助かりました。
次のように理解しました。
----------
// Unicode 5.2.0 Property-List ( http://www.unicode.org/Public/5.2.0/ucd/PropList … )
var White_Space = {
Cc: '\u0009-\u000D\u0085', // Other, control
Zs: '\u0020\u00A0\u1680\u180E\u2000-\u200A\u202F\u205F\u3000', // Separator, space
Zl: '\u2028', // Separator, line
Zp: '\u2029' // Separator, paragraph
};
----------
* アクセス
** ch04.pdf へのアクセス ( http://www.unicode.org/versions/Unicode5.2.0/ch0 … )
[The Unicode Standard] -> [Latest Version] -> [4 Character Properties]
** ch06.pdf へのアクセス ( http://www.unicode.org/versions/Unicode5.2.0/ch0 … )
[The Unicode Standard] -> [Latest Version] -> [6 Writing Systems and Punctuation]
** PropList.txt へのアクセス ( http://www.unicode.org/Public/5.2.0/ucd/PropList … )
[The Unicode Standard] -> [Unicode Character Database] -> http://www.unicode.org/Public/5.2.0/ -> ucd/ -> PropList.txt
* 参考資料
------
4.5 General Category―Normative
... (中略) ...
Table 4-9. General Category
+-----------------------------+
| Zs = Separator, space |
| Zl = Separator, line |
| Zp = Separator, paragraph |
+-----------------------------+
http://www.unicode.org/versions/Unicode5.2.0/ch0 …
------
------
6.2 General Punctuation
... (中略) ...
Table 6-2. Unicode Space Characters
+--------+------------------+
| Code | Name |
+--------+------------------+
| U+0020 | SPACE |
| U+00A0 | No-BREAK SPACE |
| U+1680 | OGHAM SPACE MARK |
| ... | ... |
+--------+------------------+
http://www.unicode.org/versions/Unicode5.2.0/ch0 …
------
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・一回も披露したことのない豆知識
- ・これ何て呼びますか
- ・チョコミントアイス
- ・初めて自分の家と他人の家が違う、と意識した時
- ・「これはヤバかったな」という遅刻エピソード
- ・これ何て呼びますか Part2
- ・許せない心理テスト
- ・この人頭いいなと思ったエピソード
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・あなたの習慣について教えてください!!
- ・ハマっている「お菓子」を教えて!
- ・高校三年生の合唱祭で何を歌いましたか?
- ・【大喜利】【投稿~11/1】 存在しそうで存在しないモノマネ芸人の名前を教えてください
- ・好きなおでんの具材ドラフト会議しましょう
- ・餃子を食べるとき、何をつけますか?
- ・あなたの「必」の書き順を教えてください
- ・ギリギリ行けるお一人様のライン
- ・10代と話して驚いたこと
- ・家の中でのこだわりスペースはどこですか?
- ・つい集めてしまうものはなんですか?
- ・自分のセンスや笑いの好みに影響を受けた作品を教えて
- ・【お題】引っかけ問題(締め切り10月27日(日)23時)
- ・大人になっても苦手な食べ物、ありますか?
- ・14歳の自分に衝撃の事実を告げてください
- ・架空の映画のネタバレレビュー
- ・「お昼の放送」の思い出
- ・昨日見た夢を教えて下さい
- ・ちょっと先の未来クイズ第4問
- ・【大喜利】【投稿~10/21(月)】買ったばかりの自転車を分解してひと言
- ・メモのコツを教えてください!
- ・CDの保有枚数を教えてください
- ・ホテルを選ぶとき、これだけは譲れない条件TOP3は?
- ・家・車以外で、人生で一番奮発した買い物
- ・人生最悪の忘れ物
- ・【コナン30周年】嘘でしょ!?と思った○○周年を教えて【ハルヒ20周年】
- ・10秒目をつむったら…
- ・人生のプチ美学を教えてください!!
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
インデント、タブかスペースか
-
ASCII文字列以外を検出する正規...
-
掲示板からIPアドレスってど...
-
XMLを作成してもタグしか表示さ...
-
テキストエリア内の改行もその...
-
GoogleChromeでレイアウトが左...
-
Hタグを改行禁止にしてspanのよ...
-
店の入口などについている、防...
-
リンク先のURLを非表示にし...
-
スマホでページ内リンクができない
-
インラインフレームの中の表示...
-
リーバイス?
-
\\n \\r \\t について
-
長いURLを途中で改行(折り返す...
-
HTML 全画面表示 リンク先の...
-
複数のgifアニメをレイヤーで重...
-
プルダウンメニューからリンク→...
-
pixivの消えないブックマークタ...
-
プルダウンメニューの開く方向...
-
高校1年生情報の問題について。
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Excel VBA 見本通りに...
-
C#のシリアル通信プログラムで...
-
ASP.NET TextBox 入力制限
-
ASCII文字列以外を検出する正規...
-
ホームページ制作でコピーライ...
-
stray '\\240' in programのエ...
-
php でtabを空白に変換して表示...
-
ボタンコントロールのTEXT...
-
ソースコードの改行文字は何に...
-
(再投稿) Word VBA マクロ スペ...
-
JavascriptでIMEのON,OFF制御
-
なぜtabによるインデントはいけ...
-
ローマ数字などの文字化け対策...
-
JSONパース時に改行があるとエ...
-
インデント、タブかスペースか
-
Pythonの勉強を始めました。バ...
-
入力されたテキストが、全角か...
-
JavaScripの文法について
-
PDF注釈の内容をJavaScriptを使...
-
半角空白チェックについて
おすすめ情報