{{category Python}} !!!Pythonでテキスト処理 {{outline}} ---- !!テキストファイルを開く +ファイルをopenで開いてから +処理をして +読み終わったら、closeで閉じる !!データの読み込み !read *内容すべて読み込み !readline *一行読み込み !readlines *一行一要素として、リスト形式で、すべて読み込み +readlinesで一行ずつ読み込む f = open('ファイル名') data = f.readlines() f.close() *dataには、一行一要素として読み込んだデータがlist配列として保存される。 data[0], data[1], data[2], ... *読み込んだ行の要素には「改行記号」も含まれている点に注意 *文字コードの指定オプション encoding='UTF-8' !!文字列の検索 !正規表現検索 re.search() *正規表現でないものは search() re.search("文字列", 検索対象) ! in ! find 文字列中の何文字目に検索対象があるか、数字を表示 !!文字列の処理 !分割 split() !結合 join() !大文字に upper() !小文字に lower() !行頭大文字 capitalize() !単語頭大文字 title() !置換 replace() replace("元の文字列", "新しい文字列") bun = bun.replace("-", "") # ハイフンの削除 *正規表現を使う場合は、re.sub() **import re として正規表現ライブラリーの使用を宣言 re.sub("元の文字列の正規表現", "新しい文字列", 対象のオブジェクト) bun = re.sub("[-━]", "", bun) !文字数 len() !出現回数 count() !文字列変換 str()