前回の続きで今回はリストのちょっとした応用です。
文字列操作
自然言語処理を扱うときなど、文字列をハンドリングする機会があります。
今回はその基礎の基礎です。
区切り文字でリストにする
まず、スペース区切りでリストにしてみます。
s = "あ い う え お"
s.split()
スペース以外ならsllitの中に区切り記号をいれてあげればOKです。
s = "あ,い,う,え,お" s.split(",")
逆に、リストを文字列にする
もちろん上記の逆も可能です。
l = ["あ", "い", "う", "え", "お"] "".join(l)
joinに引数を与えると区切り文字として挿入してくれます。
l = ["あ", "い", "う", "え", "お"] ",".join(l)
注意!! 数値を連結する際は文字列に変換しましょう!!
# str で数値を文字列に変換する。 l = [1, 2, 3, 4, 5] l = [str(i) for i in l] ",".join(l)
数値のままだとエラーになるので気を付けましょう。
指定文字の除去
不要な文字を削除したい時は、けっこうな頻度であるのでぜひ覚えよう。
まずは、前後の文字列の削除
s= "-あいうえお-" s.strip("-")
stlipは前後の文字だけを対象にします。
# stripで除去できるのは前後の文字列のみ s= "-あいう-えお-" s.strip("-")
全部取り除きたいときはreplaceを使うとよいです!!
s= "-あいうえお-" s.replace("-","+")
以上、今回はここまで