文字列操作

公開日:2025/05/30

文字列操作

Pythonにおける文字列処理の基本メソッドと操作。データ処理、テキスト分析、ユーザー入力の処理など、あらゆるプログラムで頻繁に使用される重要な機能。

基本的な文字列メソッド:
・replace(old, new):文字列の置換
・strip():先頭・末尾の空白除去
・split(separator):文字列を分割してリスト化
・join(iterable):リストを結合して文字列化
・upper()/lower():大文字・小文字変換

空白処理の技法:
・replace(' ', ''):全ての空白を除去
・strip():先頭・末尾のみ除去
・lstrip()/rstrip():左側・右側のみ除去
・正規表現:re.sub(r'\s+', '', text)で複雑な空白処理

文字列の不変性:
・Pythonの文字列は不変(immutable)オブジェクト
・操作結果は新しい文字列として返される
・元の文字列は変更されない
・変更結果を保存するには代入が必要

実務でよく使う操作:
・データクリーニング:空白、改行、特殊文字の除去
・CSVデータの処理:split(',')でフィールド分割
・ユーザー入力の正規化:strip().lower()で統一
・ファイル名の処理:拡張子の抽出・変更

文字エンコーディング:
・encode():文字列をバイト列に変換
・decode():バイト列を文字列に変換
・UTF-8:最も一般的なエンコーディング
・日本語処理での注意点

f文字列(Python 3.6+):
・f"Hello {name}":変数埋め込み
・f"{value:.2f}":書式指定
・効率的で可読性の高い文字列フォーマット

パフォーマンス考慮事項:
・大量の文字列結合はjoin()を使用
・正規表現は事前にコンパイル
・不要な文字列生成を避ける