【無料配信♪】Renta !全タテコミ作品第1話

お世話になります。
現在、pythonにてあるディレクトリの一覧を表示させるプログラムをしているのですが、対象の中に日本語を含むディレクトリ・ファイルがあると
処理が行われません。

現在書いているコードです。↓
#! /usr/bin/env python
# -*- coding: utf-8 -*-
# ファイルとサブディレクトリのパスを表示する
import os, os.path
path = "D:\Myfiles\あいうえお\ "
for root, dirs, files in os.walk(path):
for file in files:
print os.path.join(root)


環境はwindowsXP,python2.6です。
エンコード・デコードを行ったのですがうまくいきませんでした。
ちなみに、pathに日本語が含まれない場合には、一覧が取得できます。

お手数ですが、分かる方いらっしゃいましたら教えてくださいませ。

このQ&Aに関連する最新のQ&A

A 回答 (3件)

上のコードを正しくインデントするとこうでしょうか?



import os, os.path
path = "D:\Myfiles\あいうえお\ "
for root, dirs, files in os.walk(path):
___ for file in files:
_______ print os.path.join(root)

こうすると、ディレクトリの中にあるファイルの数(!)だけ
そのディレクトリの名前(!)を表示するってコードになるんですが、
正しい動作なんでしょうか?

# -*- coding: utf-8 -*-

あと、こう書いてあるってことは
ソースコードはUTF-8で書いてますよね?
この場合、ディレクトリやファイルを指定するパスは
全てunicode文字列にする必要があります。
(もしくは明示的にShift_JISに変換する。)
よって以下のように書いてください。

path = u"D:\\Myfiles\\あいうえお"

\ のエスケープもお忘れなく。

ちなみに、os.walk関数の引数にunicodeを渡すと
戻り値もunicodeになります。

それから、os.path.join関数は
複数の文字列をパスとして結合する関数です。
上のコードからは何がしたいのかよく意味が汲み取れないのですが、
ファイルの一覧を絶対パス(!)で欲しいということであれば
以下のようにrootとfileを引数に指定します。

print os.path.join(root, file)

あと、fileはビルトイン型として存在するので
変数として使わないほうがいいです。

尚、osをimportすると、os.pathは自動的にimportされます。

以上をまとめると、正しいコードはこうでしょうか。

# ファイル(!)とサブディレクトリ(!)のパスを表示する
import os
path = u"D:\\Myfiles\\あいうえお"
for root, dirs, files in os.walk(path):
___ for f in files:
_______ print os.path.join(root, f)
___ for d in dirs:
_______ print os.path.join(root, d)

参考URL:http://docs.python.org/library/os.html#os.walk
    • good
    • 0
この回答へのお礼

ご回答ありがとうございました。
理想の形になりました!

色々試していた中でつまずいた結果、上記コードになりました。
なんかpythonが楽しくなってきました!

本当にありがとうございました。

お礼日時:2009/08/04 17:37

次の方法で対応出来そうです。



print os.path.join(dirs)
print os.path.join(files)
→変更点
print str(os.path.join(dirs)).decode("Unicode-Escape")
print str(os.path.join(files)).decode("Unicode-Escape")

#全角コード変換は面倒ですね。
    • good
    • 0
この回答へのお礼

なるほど!

ただ、上記の結果を行うと
print str(os.path.join(dirs)).decode("Unicode-Escape")
[u'aaa', u'新しいフォルダ']
となります。「u」はしょうがないんでしょうか。。
さらにこれは私の環境のみ出力され、他のマシンではフォルダ名/ファイル名のみ表示されるという不可解さ。

pythonは日本語の扱いで苦戦しますね。

色々と勉強になりました。
ありがとうございました。

お礼日時:2009/08/04 15:37

ちょっと手元の環境で確認しましたが次の修正を行うと改善されるかも


しれません。

【修正点】
path = "D:\Myfiles\あいうえお\ "
【お試し】
path = u"D:\\Myfiles\\あいうえお\\"

この回答への補足

ご回答ありがとうございました。
教えて頂いた方式で上手く言ったのですが、
上記コードの下に以下の内容を記述したところ
print os.path.join(dirs)
print os.path.join(files)
日本語ファイルの結果が、u'\ubna~
のような結果になりました。日本語化して表示したいのですが
デコード?などうまくいかず。。
もしご存じでしたら併せてご教授いただけないでしょうか?
宜しくお願いいたします。

補足日時:2009/08/04 10:03
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qpython print文のエラー

こんにちは。
今日、リカバリしたばかりのPCに、python3.1をインストールしコマンドラインモードからテスト代わりに

「print "Hello world!"」

と打って実行してみました。
しかし、「SyntaxError: invalid syntax」とエラーが出ます。
「print "Hello world!"」の最後の「"」でエラーが発生していると出たのですが、どういうことなのでしょうか。

pythonは始めたばかりで、参考書で最初に書いてあったのを実行してみたのですが…。しょっぱなからこれだと残念です。私の環境が悪いのかも知れませんが。

プログラミング経験はC、C++で中規模のアプリケーション、2Dゲームを作成した程度です。

お願いします。

Aベストアンサー

現時点でのPythonの書籍はおそらくver2.x用だと思いますが、Python3からいくつか文法が変更されています。
http://docs.python.org/3.0/whatsnew/3.0.html

printは、以前は構文でしたが、関数になったので、カッコが必須です。
print("Hello world!")

Q[python] 文字列を変数名として使いたい

すいません教えて下さい。

pythonで以下の変数をセットしています。

aaa = 'hensu_name'

aaaで指定した'hensu_name'に対して値を入れたい場合は
どのように実装すればよいでしょうか?
(aaaに入れたstringを変数名にしたい)

よろしくお願いします。

Aベストアンサー

exec関数を使って文字列をコードとして実行すれば、それっぽいことができるように思います。
あまりいい例を思いつかないですが、以下のような感じでしょうか?

aaa = "hensu_name"
src = aaa + " = 'hello'" #srcの中身は、"hensu_name = 'hello'"

exec(src)
print hensu_name #hello が表示される

src = "print " + aaa #srcの中身は、"print hensu_name"
exec(src) #hello が表示される


ただ、No.1の方がおっしゃっているように、あまりお勧めな方法ではありません。
文字列をコードとして実行してしまうので、少々危険な側面もあります。
悪意のあるコードを含む文字列を実行してしまうとか…。

Q加重平均と平均の違い

加重平均と平均の違いってなんですか?
値が同じになることが多いような気がするんですけど・・・
わかりやす~い例で教えてください。

Aベストアンサー

例えば,テストをやって,A組の平均点80点,B組70点,C組60点だったとします.
全体の平均は70点!・・・これが単純な平均ですね.
クラスごとの人数が全く同じなら問題ないし,
わずかに違う程度なら誤差も少ないです.

ところが,A組100人,B組50人,C組10人だったら?
これで「平均70点」と言われたら,A組の生徒は文句を言いますよね.
そこで,クラスごとに重みをつけ,
(80×100+70×50+60×10)÷(100+50+10)=75.6
とやって求めるのが「加重平均」です.

Q~以外を削除する場合(rmコマンド)

linuxのコマンドで
~以外のファイル、ディレクトリを全て削除したい時は
どのような記述をすれば良いのでしょうか?
シェルスクリプトではなくrmコマンド1つで削除したのいですが…

例: tar以外のファイル・ディレクトリを
   すべて削除したい場合など

どなたかご存知の方がいらっしゃったら
教えてください。よろしくお願い致します。

Aベストアンサー

rm コマンドのみという訳にはいきませんが基本的なコマンドを組み合わせると実現可能と思います。

「名前が tar で終わるもの以外のファイル・ディレクトリを削除する」場合だと

ls | grep -v -E 'tar$' | xargs rm -r

となります。

ファイルの一覧を取得し ( ls )
'tar'で終わるもの以外を抽出し ( grep )
その結果を rm -r の引数に指定して実行 ( xargs )

という流れです。

ファイルを削除するような操作については失敗するとダメージが大きいので、事前にテストして動作を確認すると良いとおもいます。また rm -r -i としてそれぞれのファイルについて、削除の問い合わせをするのも有効です。

QEXCELファイルのカレントフォルダを取得するには?

EXCELファイルのカレントフォルダを取得するには?

C:\経理\予算.xls

D:\2005年度\予算.xls

EXCEL97ファイルがあります。

VBAで
  カレントフォルダ名
(C:\経理\,D:\2005年度\)
を取得する事は可能でしょうか?

CURDIRでは上手い方法が見つかりませんでした。

Aベストアンサー

こんばんは。
Excel97 でも、同じですね。以下で試してみてください。

Sub test()
'このブックのパス
a = ThisWorkbook.Path
'アクティブブックのパス
b = ActiveWorkbook.Path
'Excelで設定されたデフォルトパス
c = Application.DefaultFilePath
'カレントディレクトリ
d = CurDir
MsgBox "このブックのパス   : " & a & Chr(13) & _
   "アクティブブックのパス: " & b & Chr(13) & _
   "デフォルトパス    : " & c & Chr(13) & _
   "カレントディレクトリ : " & d & Chr(13)
End Sub

Qsedの置換文字に変数を使用したいのですが・・・

あるファイルの特定の文字を変換し、上書きをする処理を行いたいのですが、sedの置換文字に変数が渡せなくて困っています。

例:
X="a"
Y="b"
echo test.txt | sed 's/${X}/${Y/g}' >test.txt

sedでは置換文字に${X}といった変数を使用することはできないのでしょうか?

Aベストアンサー

' ・・・' で囲まれた中の$はそのままドルマークです。変数展開をするなら、'・・・'で囲んではいけません。

何も囲まないか、"・・・"で囲むかです。

QPythonでテキストを行数指定して読み込む

Pythonの勉強を始めて4ヶ月ほどの者です。
今、コマンドライン(Winでのコマンドプロンプト、Linux系での端末など)からPythonでメールアドレスが書いてあるテキストを読み込み、そのアドレスにメールを送るプログラムを考えてます。
具体的には、address.txtというファイルに、
aaa.example@test.ne.jp
bbb.example@test.ne.jp
ccc.example@test.ne.jp
という風に記述してあるとします。(一行に一アドレスです。)
プログラムの部分(最初からではなく途中です)は、
print "Select the E-mail Address below"
a = open("Address.txt")
for i in a:
print i
to = raw_input(":")
とまできたんですが、自分としては読み込んだ「Address.txt」に書かれてるアドレスを行数ごとに指定して読み込みたいんです。つまりraw_input(":")に
1を入れたら1行目を指定→「aaa.example@test.ne.jp」
2を入れたら2行目を指定→「bbb.example@test.ne.jp」
3を入れたら3行目を指定→「ccc.example@test.ne.jp」
が選択されるようにし、変数toに代入されるようにしてSMTPモジュールのto_addrに引き渡すようにしたいのです。

ですが行数を指定してテキストを読み込むメゾットやオブジェクトが入ってるモジュールや関数はありますか?

Pythonは2.6.4と3.0.1の両方のバージョンが入ってます。できれば両方で動かしたいので3.0.1で仕様の変更があったら教えてもらえるとありがたいです。
OSはメインがWinXPSP3、サブ(テスト用、VMWare使用)にUbuntu9.04(Pythonは2.6系だったと思います。)

Pythonの勉強を始めて4ヶ月ほどの者です。
今、コマンドライン(Winでのコマンドプロンプト、Linux系での端末など)からPythonでメールアドレスが書いてあるテキストを読み込み、そのアドレスにメールを送るプログラムを考えてます。
具体的には、address.txtというファイルに、
aaa.example@test.ne.jp
bbb.example@test.ne.jp
ccc.example@test.ne.jp
という風に記述してあるとします。(一行に一アドレスです。)
プログラムの部分(最初からではなく途中です)は、
print "Select the E-mail Address below"...続きを読む

Aベストアンサー

以下、字下げを表現するのに全角空白を使っています。コピーしたら置き換えましょう。
a = open("Address.txt")
lines = []
for line in a:
 print line
 lines.append(line)
to = raw_input(":")
addr = lines[to+1]
これでaddrに指定行のアドレスが入るはずです。

QPythonで元CSVファイルの一部列を抜き出す

Python初心者です。どうぞよろしくお願い致します。

インターネットを色々検索していますが苦戦していますので投稿させてください。

下記のような元CSVファイルから、不要な列だったり、空白の列をカットして
必要な列だけのCSVとして新たなファイルとして出力したいと思っています。

元CSVファイル (上からタイトル行とサンプル2行抜き出し)※Excelでの画像添付しています

ID,URI,body,text_author,text_flg,text_source,text_updatetime,text_url,DATE,DATE_2
1, csv://10.182.XXX, "comment A, comment B, comment C", Mr.A, , SourceA, , http://www.yahoo.co.jp, 1.37667E+12, 20130817
2, csv://10.183.XXX, "comment D, comment E, comment F", Mr.B, , SourceB, , http://www.goo.co.jp, 1.37667E+12, 20130817

(期待する出力結果)
body,text_author,text_source,text_url,DATE_2
"comment A, comment B, comment C", Mr.A, SourceA, http://www.yahoo.co.jp, 20130817
"comment D, comment E, comment F", Mr.B, SourceB, http://www.goo.co.jp, 20130817

つまり、元のファイルの列の(一番左がRow(0)として)Row(2),Row(3), Row(5), Row(7), Row(9)だけを
各行抜き出して新たなCSVファイルとして出力したいと思っています。
ちなみに行数は1000の場合も10000の場合もあります。

最初は、gawkで処理しようと思っていましたが、抜き出したいうちのひとつRow(2)には、
不定期で複数のカンマが含まれているため、gawkでは正しく列分類ができず、
Pythonを学習がてらうまくできないかと思っています。

実は締め切りが近いので結構あせっているのですが、(自分のセンスのなさにヘキヘキ・・)
どなたかこのようにCSVを処理できるPythonのやり方を教えて頂けないものでしょうか。

どうぞよろしくお願い致します。

Python初心者です。どうぞよろしくお願い致します。

インターネットを色々検索していますが苦戦していますので投稿させてください。

下記のような元CSVファイルから、不要な列だったり、空白の列をカットして
必要な列だけのCSVとして新たなファイルとして出力したいと思っています。

元CSVファイル (上からタイトル行とサンプル2行抜き出し)※Excelでの画像添付しています

ID,URI,body,text_author,text_flg,text_source,text_updatetime,text_url,DATE,DATE_2
1, csv://10.182.XXX, "comment A, comment B,...続きを読む

Aベストアンサー

#1補足について。

出力されたCSVを、テキストエディタで開いてください。
# Excelで開くと、中身が解釈されて、どんな状態か判断しずらくなります。
インタプリタでの出力と同じ内容になっているはずです。

インタプリタでの結果は
comment A, comment B, comment C Mr.A SourceA http://www.yahoo.co.jp 20130817
ですから、CSVとして解釈すると
comment A
comment B
comment C Mr.A SourceA http://www.yahoo.co.jp 20130817
の3項目となります。

出力させたいのは、
"comment A, comment B, comment C",Mr.A,SourceA,http://www.yahoo.co.jp,20130817
というのでは?

CSVで "~" と"でくくってあったら、その中身が項目の本体です。ですから、"を取った状態で取り込むのが普通です。
その状態が row[2]です。
逆に、CSVに出力するなら、 ""でくくらないと、項目内の文字としてのカンマではなく、項目区切りのカンマだと解釈されてしまいます。
ですから、"で括って出力するようにします。例えば、 '"'+row[2]+'"' とか。

printに,で複数の項目を指定すると、それぞれの間をスペースで区切って出力されます。
CSVとしてカンマ区切りにするなら、次の方法のいずれかを使います。
・文字列のjoinメソッドを使う(csvモジュールのマニュアルのサンプロコードにある例)
・数が固定なら、%で書式指定する
例) print '"%s",%s,%s,%s,%s' %(row[2], row[3], row[5], row[7], row[9])
・print関数のsep=で指定する。(Python3,あるいは2.6以降でprint関数有効時)
・csv.writerを使う

#1補足について。

出力されたCSVを、テキストエディタで開いてください。
# Excelで開くと、中身が解釈されて、どんな状態か判断しずらくなります。
インタプリタでの出力と同じ内容になっているはずです。

インタプリタでの結果は
comment A, comment B, comment C Mr.A SourceA http://www.yahoo.co.jp 20130817
ですから、CSVとして解釈すると
comment A
comment B
comment C Mr.A SourceA http://www.yahoo.co.jp 20130817
の3項目となります。

出力させたいのは、
"comment A, comment B, comment C",Mr.A...続きを読む

Qpythonでバイナリデータを配列に読み込みたい

python初心者なので、できるだけお手柔らかにお願いします。
pythonのバージョンは2.7.3です。

=====================================================
あるバイナリデータ(test.bin)から、
2バイトずつ100*100の2次元配列に読み込ませたいのですが、
配列への読み込ませ方が分からず悩んでいます。
=====================================================


#### ここから sampleスクリプト(未完) ################

f = open("./test.bin", "rb")

x = 100
y = 100
bytesize = 2

data = f.read(bytesize*x*y)

array = [[0 for j in range(x)] for i in range(y)]
##############################################

上記の後、arrayの各要素に2byteずつ整数値としてデータを読み込ませたいのですが、
dataからarrayへの受け渡し方法が分からず悩んでいます。
かなり初歩的な質問かも知れませんが、ヒントでもいいので教えて下さい。

また、上記の時点で誤っていることがありましたら
ご教授お願いします。

python初心者なので、できるだけお手柔らかにお願いします。
pythonのバージョンは2.7.3です。

=====================================================
あるバイナリデータ(test.bin)から、
2バイトずつ100*100の2次元配列に読み込ませたいのですが、
配列への読み込ませ方が分からず悩んでいます。
=====================================================


#### ここから sampleスクリプト(未完) ################

f = open("./test.bin", "rb")

x = 100
y = 100
bytesize = 2

data = f.read(bytesize*x...続きを読む

Aベストアンサー

http://docs.python.jp/2/library/stdtypes.html#file.read
にあるように、ファイルオブジェクトのreadはstringを返します。つまり、
data = f.read(bytesize*x*y)
なら、dataがstringです。
stringなので、Xバイト目の「文字」は
data[X]
で取り出せます。
これは、元のバイナリデータの1バイトを、対応する「文字」にしたものです。元のバイナリデータを得るには、逆変換する必要があります。文字のコードを得るのには、ord関数( http://docs.python.jp/2/library/functions.html#ord )を使います

ord(data[X])

2バイトから16bitの整数を取るには、まず、2バイトそれぞれの値を得ます
a0=ord(data[X0])
a1=ord(data[X1])
ここで、上位を8ビット左へシフトして、下位とのORを取れば、16ビットになります。
ただ、上記のa0,a1のどちらが上かは、どう保存したかによるので、今ある情報だけでは判断できません。
# a0が上なら
Y=a0 << 8 | a1

また、符号有り16bit整数だと、もう少し複雑になります。


全てのi,jについて、array[i][j]に対応するバイト位置 X0,X1 を求め、計算した値を代入する、という流れになります

http://docs.python.jp/2/library/stdtypes.html#file.read
にあるように、ファイルオブジェクトのreadはstringを返します。つまり、
data = f.read(bytesize*x*y)
なら、dataがstringです。
stringなので、Xバイト目の「文字」は
data[X]
で取り出せます。
これは、元のバイナリデータの1バイトを、対応する「文字」にしたものです。元のバイナリデータを得るには、逆変換する必要があります。文字のコードを得るのには、ord関数( http://docs.python.jp/2/library/functions.html#ord )を使います

ord(data[X])...続きを読む

QHTMLからフォルダを開きたい

いつも大変お世話になります<(_ _)>

Webサーバー上にあるWebページ(HTML)の中に、ローカルPCのフォルダを開くリンクを付けたいのですが、
<a href="file://c:\windows">OPEN</a>
としても、何も反応しません。

いろいろ調べたのですが、上記の方法しか見あたりません。

なお、ブラウザのアドレス欄に file://c:\windows と入力すると、フォルダの内容が表示されます。
※Firefoxだと、ファイルの一覧になりますが・・・

何か環境によって挙動が異なるのでしょうか?
それとも、セキュリティ上の観点から最近じゃ出来なくなっているのでしょうか?

是非ともお助け下さい。宜しくお願い致します。

Aベストアンサー

file:///C:/windows/
/は三つでは・・・
 IEの場合はエクスプローラ(ファイルマネージャ)が開くような・・・
 IEはファイルマネージャーと一体のブラウザなので・・・

★実は、ローカルサーバーが必要です。
 apacheでも何でも良いので、WEBデータの入っているフォルダーを
<VIRTUALHOST 127.0.0.1>
C:\Document and settings\my document\web
 とかに指定して、Windowsのhostsファイルで、適当なサーバー名を指定しておきます。
myLocalhost 127.0.0.1
とか・・・

 そうすると
http://myLoclahost/
 で開けます。

 


人気Q&Aランキング