アプリ版:「スタンプのみでお礼する」機能のリリースについて

コピー&ペースト時の文字コードに関して質問させてください。

Webページの本文などをコピーし、テキストエディタやブラウザ上のPHPで作ったスクリプトページにコピーなどして、データベースなどに保存した場合、
その文字コードは何になるのでしょうか?

ある場所で質問した際、LANG変数の値じゃないかと言われました。
なのでLinuxを使用している自分の環境でやってみたところ、
$ echo $LANG
ja_JP.utf8
となりました。

このページ(http://www.itmedia.co.jp/help/tips/linux/l0176.h …)を参考に/etc/profile内を見てみたのですが、LANGに関するものは見当たりませんでした。
ま、UTF-8で設定されているのでUTF-8で統一したい自分にとってはそれで良いのですが。


で、もし対象のWebページのHTMLが例えEUC-JPやShift-JISで書かれていたとしても、
Linuxでコピペした場合は文字コードはUTF-8と考えてもいいのでしょうか?


こういうページ(http://oshiete.goo.ne.jp/qa/2940513.html)にも質問ありましたが、環境がWindowsの為分かりませんでした。

A 回答 (2件)

X Windows Systemのクリップボードであれば、ISO2022ベースのコンパウンドテキストという文字コードです。


https://www.google.co.jp/search?q="コンパウンドテキスト"

アプリケーション側で使う文字コードとは自動的に変換されるはず。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございました。

という事は、データベース格納時に、
一応現在の文字コードを自動で判別してからUTF-8に変換し、データベースへ格納した方が文字化けに悩まされず良さそうですね?

テキストエディタなどもおそらくデータの保存時に、デフォルトの文字コード(最近ではUTF-8)に変換しているのかもしれないと思いました。

お礼日時:2014/02/24 21:02

ウェブブラウザーでシフトJISで書かれたサイトを表示しても


正常に日本語で表示されているのであれば
そのウェブブラウザーの動く環境の、標準の文字コードに変換されていますよ。

コピー操作は、そのもとのシフトJISのHTML文書に対してではなく
ウェブブラウザーが表示しているUTF-8の文字列に対して行われるので

必然的に、OSがUTF-8を標準としていれば
UTF-8の文書からのコピーアンドペーストということになります。


やったことがありませんが、charsetが間違っているサイトでは化けた状態で表示されるでしょ?
その状態から全文コピペすると、化けたまま別のソフトのペーストされますよ。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!