プログラ生活

プログラム初学者のためのポイントを書いていこうと思います。たまに脇道それた記事もありますが、息抜きだとおもって気長にお付き合いください。

【Python連載】リストを使った文字列操作-018-

www.pon-x.jp

前回の続きで今回はリストのちょっとした応用です。

文字列操作

自然言語処理を扱うときなど、文字列をハンドリングする機会があります。
今回はその基礎の基礎です。

区切り文字でリストにする

まず、スペース区切りでリストにしてみます。

s = "あ い う え お"

s.split()

f:id:hanabusa-snow:20210916112439p:plain

スペース以外ならsllitの中に区切り記号をいれてあげればOKです。

s = "あ,い,う,え,お"

s.split(",")

f:id:hanabusa-snow:20210916112528p:plain

逆に、リストを文字列にする

もちろん上記の逆も可能です。

l = ["あ", "い", "う", "え", "お"]

"".join(l)

f:id:hanabusa-snow:20210916112637p:plain

joinに引数を与えると区切り文字として挿入してくれます。

l = ["あ", "い", "う", "え", "お"]

",".join(l)

f:id:hanabusa-snow:20210916112726p:plain

注意!! 数値を連結する際は文字列に変換しましょう!!

# str で数値を文字列に変換する。

l = [1, 2, 3, 4, 5]
l = [str(i) for i in l]

",".join(l)

f:id:hanabusa-snow:20210916112821p:plain
数値のままだとエラーになるので気を付けましょう。

指定文字の除去

不要な文字を削除したい時は、けっこうな頻度であるのでぜひ覚えよう。
まずは、前後の文字列の削除

s= "-あいうえお-"

s.strip("-")

f:id:hanabusa-snow:20210916112946p:plain

stlipは前後の文字だけを対象にします。

# stripで除去できるのは前後の文字列のみ

s= "-あいう-えお-"

s.strip("-")

f:id:hanabusa-snow:20210916113024p:plain

全部取り除きたいときはreplaceを使うとよいです!!

s= "-あいうえお-"

s.replace("-","+")

f:id:hanabusa-snow:20210916113102p:plain

以上、今回はここまで