String::chars() / bytes() / parse()

対応:		Rust 1.0（2015）

Rustの文字列には『chars()』（Unicode文字のイテレータ）・『bytes()』（バイトのイテレータ）・『parse()』（文字列から数値への変換）などのメソッドがあります。大文字小文字変換も組み込みで対応しています。

構文

let s = String::from("Hello, 世界");

// Unicode文字のイテレータを返します
for c in s.chars() { /* ... */ }

// バイトのイテレータを返します
for b in s.bytes() { /* ... */ }

// 文字列を任意の型に変換します（型を明示します）
let n: i32 = "42".parse().unwrap();
let f: f64 = "3.14".parse().unwrap();

// parse() の戻り値はResult型です
let result: Result<i32, _> = "abc".parse();
match result {
    Ok(n) => println!("数値: {}", n),
    Err(e) => println!("変換失敗: {}", e),
}

// 大文字・小文字変換です
let upper = s.to_uppercase();
let lower = s.to_lowercase();

メソッド一覧

メソッド	概要
s.chars()	Unicode文字（char）のイテレータを返します。
s.char_indices()	(バイトオフセット, char)のイテレータを返します。
s.bytes()	UTF-8バイトのイテレータを返します。
s.chars().count()	Unicode文字数を返します。
s.chars().nth(n)	n番目のcharをOption<char>で返します。
s.parse::<T>()	文字列をT型に変換してResult<T, E>を返します。
s.to_uppercase()	大文字に変換した新しいStringを返します。
s.to_lowercase()	小文字に変換した新しいStringを返します。
s.to_ascii_uppercase()	ASCII文字のみ大文字に変換します。
s.to_ascii_lowercase()	ASCII文字のみ小文字に変換します。
s.chars().collect::<String>()	charイテレータをStringに再構築します。

サンプルコード

string_chars_parse.rs

fn main() {
    let s = "Hello, 世界!";

    // chars()でUnicode文字を一つずつ処理します
    println!("--- chars() ---");
    println!("文字数: {}", s.chars().count());
    println!("バイト数: {}", s.len());

    let chars: Vec<char> = s.chars().collect();
    println!("chars[0]: {}", chars[0]);    // 'H'
    println!("chars[7]: {}", chars[7]);    // '世'

    // char_indicesでオフセットと文字を同時に取得します
    println!("\n--- char_indices（最初の5文字）---");
    for (i, c) in s.char_indices().take(5) {
        println!("  オフセット={}, 文字='{}'", i, c);
    }

    // bytes()でバイト列を処理します
    println!("\n--- bytes（最初の5バイト）---");
    let first5: Vec<u8> = s.bytes().take(5).collect();
    println!("  {:?}", first5);

    // parse()で文字列を数値に変換します
    println!("\n--- parse() ---");
    let n: i32 = "42".parse().unwrap();
    let f: f64 = "3.14".parse().unwrap();
    println!("i32: {}", n);
    println!("f64: {}", f);

    // エラー処理つきのparse()です
    let inputs = ["100", "-5", "abc", "3.14"];
    for input in inputs {
        match input.parse::<i32>() {
            Ok(n) => println!("  '{}'  => i32: {}", input, n),
            Err(e) => println!("  '{}'  => エラー: {}", input, e),
        }
    }

    // 大文字・小文字変換です
    println!("\n--- 大文字・小文字 ---");
    let mixed = "Hello, World!";
    println!("to_uppercase: {}", mixed.to_uppercase());
    println!("to_lowercase: {}", mixed.to_lowercase());

    // charsを使って各文字を変換する例です
    let reversed: String = mixed.chars().rev().collect();
    println!("reversed: {}", reversed);

    let only_alpha: String = mixed.chars().filter(|c| c.is_alphabetic()).collect();
    println!("アルファベットのみ: {}", only_alpha);
}

rustc string_chars_parse.rs
./string_chars_parse
--- chars() ---
文字数: 10
バイト数: 14
chars[0]: H
chars[7]: 世

--- char_indices（最初の5文字）---
  オフセット=0, 文字='H'
  オフセット=1, 文字='e'
  オフセット=2, 文字='l'
  オフセット=3, 文字='l'
  オフセット=4, 文字='o'

--- bytes（最初の5バイト）---
  [72, 101, 108, 108, 111]

--- parse() ---
i32: 42
f64: 3.14
  '100'  => i32: 100
  '-5'  => i32: -5
  'abc'  => エラー: invalid digit found in string
  '3.14'  => エラー: invalid digit found in string

--- 大文字・小文字 ---
to_uppercase: HELLO, WORLD!
to_lowercase: hello, world!
reversed: !dlroW ,olleH
アルファベットのみ: HelloWorld

概要

『chars()』はRustで文字列を1文字ずつ処理する基本的な方法です。Rustのchar型は4バイトのUnicodeスカラー値なので、日本語や絵文字も1文字として正しく扱えます。

『parse()』は型を推論または明示して文字列を変換します。戻り値は『Result』型なので、変換失敗時のエラーを安全に処理できます。型の指定は『"42".parse::<i32>()』のようにターボフィッシュ構文か変数の型アノテーションで行います。

chars()が返すイテレータはO(n)です。特定のn番目の文字を取得するs.chars().nth(n)は先頭からn文字分を走査するため、ランダムアクセスには向きません。

記事の間違いや著作権の侵害等ございましたらお手数ですがこちらまでご連絡頂ければ幸いです。

トップページへ

Rust辞典

String::chars() / bytes() / parse()

構文

メソッド一覧

サンプルコード

string_chars_parse.rs

概要