文字列

2017-12-21 (木) 18:47:00 (2312d) | Topic path: Top / 授業 / C言語基礎 / 文字列

これまで、文字列は、ダブル・クォーテーション " で囲まれたもので、printf関数またはscanf関数に渡すだけのものでした。

実は、文字列は文字を並べたデータ、つまり、文字の配列です。

文字列はchar型の配列

文字列は、複数の文字を並べたものであり、char型の配列として扱われます。

  char s[] = "ABC";

文字列を出力するときの変換指定子は %s

printf関数で、変数に格納された文字列を出力するときは、変換指定子を%sとします(プログラム1)。

  char s[] = "ABC";

  printf(">> %s\n", s);

演習1

プログラム1を作成し、実行結果を確認せよ。

文字列の最後は \0

実は、文字列の最後には、ナル文字 \0 という文字(エスケープ・シーケンス)があります。

つまり、"ABC" という文字列は、文字 A、文字 B、文字 C、そしてナル文字 \0 から成る長さ4の配列です。

配列なので、sizeof演算子で配列全体のサイズと要素のサイズから配列の要素数を求めることができます。 また、ナル文字を文字として表示することはできませんが、文字コードは 0 なので文字コードを表示すると確認できます。(プログラム2)。

  char s[] = "ABC";
  int i, len;

  len = sizeof(s) / sizeof(s[0]);
  for (i = 0; i < len; i++) {
    printf("%d\n", s[i]);
  }

(len は配列 s の要素数です。文字列 s の長さではありません。文字列の長さを sizeof で調べることはできません。その理由はこの後で勉強します。)

このプログラムを実行すると、次のようになります。

luna% a.out
>> 4
64
65
66
0

演習2

プログラム2を作成し、実行結果を確認せよ。

文字列は \0 まで

文字列の最後はナル文字 \0 なので、文字列の途中に \0 を代入すると、文字列がそこまでで終わりになります(プログラム3)。

  char s[] = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
  s[7] = '\0';

  printf(">> %s\n", s);

このプログラムを実行すると、次のようになります。

luna% a.out
>> ABCDEFG

配列 s の長さは最後のナル文字を含めて 27 ですが、文字列 s はナル文字が出てくると終わりなので、文字列 s の長さは 7 です。 ですから、sizeof では文字列の長さを調べることはできません。

演習3

プログラム3を作成し、実行結果を確認せよ。

初期化のとき以外は文字列を直接代入できない

上のプログラムのように、文字列を格納する変数を宣言すると同時に初期化するときには、変数に文字列を直接代入できますが、それ以外のときは文字列を直接代入することができません(プログラム4)。

  char s[4];

  s = "ABC";

  printf(">> %s\n", s);

演習3

プログラム4に作成し、コンパイル結果を確認せよ。

文字を一つずつ代入して文字列を作る

文字列は文字の配列ですから、配列の要素を一つずつ代入するように、文字を一つずつ代入することができます。 このとき、最後にナル文字を追加するのを忘れないようにしましょう(プログラム5)。

  char s[4];

  s[0] = 'A';
  s[1] = 'B';
  s[2] = 'C';
  s[3] = '\0';

  printf(">> %s\n", s);

演習5

プログラム5を作成し、実行結果を確認せよ。

文字列をキーボードから入力する

scanf関数を使って、文字列をキーボードから入力することができます。 変換指定子にはprintf関数と同じ %s を使いますが、代入される変数の前にアンパサンド & を付けません。

  char s[8];

  scanf("%s", s);
  printf(">> %s\n", s);

ただし、文字列の長さが入力された文字数より大きくないと(入力された文字数+1以上でないと)、セグメント・エラーになる可能性があります。 そこで、変換指定子に文字数を指定して、入力される文字列の長さを制限します(プログラム6)。

  char s[8];

  scanf("%7s", s);
  printf(">> %s\n", s);

文字数を指定すると、最後にナル文字 \0 を追加します。 ですから、文字数は、配列の長さより1小さい数以下でないとセグメント・エラーになる可能性があります。

このプログラムを実行し、"1234567890"と入力すると、結果は次のようになります。

luna% a.out
1234567890
>> 1234567

8文字目はナル文字になるので、7文字しかないように見えます。

演習6

プログラム6を作成し、実行結果を確認せよ。

文字列を引数とする関数を作る

文字列は文字の配列なので、char型の配列を引数とする関数を作ることで、文字列を引数とする関数を作ることができます。

配列を引数として関数を定義するとその要素数が無視されるので、配列の全ての要素にアクセスする関数を関数を作るときは、配列の長さも引数として受け取る必要があります。

しかし、文字列の場合は、最後がナル文字 \0 であることがわかっているので、先頭からナル文字 \0 が出てくるまで順番にアクセスすれば、要素数を受け取らなくても全ての文字にアクセスすることができます。

たとえば、文字列を引数として受け取るとその文字数を返す関数は、次のように定義できます(プログラム7)。

#include <stdio.h>

int strlen(char s[]) {
  int i = 0;

  while (s[i] != '\0') {  i++; }

  return i;
}

int  main(void) {
  char s[16];
  int len;

  printf("英単語を入力してください");
  scanf("%15s", s);

  len = strlen(s);
  printf("%d文字\n", len);

  return 0;  
}

演習7

プログラム7を作成し、実行結果を確認せよ。

文字列操作関数を使う(おまけ)

C言語には、文字列を操作するための関数(文字列操作関数)がいくつか用意されています。

文字列操作関数を使うには、string.h をインクルードします。

#include <string.h>

文字列操作関数には、次のようなものが用意されています。

  • 文字列の長さを調べる strlen関数
  • 文字列をコピー代入)する strcpy関数
  • 文字列を指定された文字数だけコピー代入する) strncpy関数
  • 文字列を連結する strcat関数
  • 文字列を指定された文字数だけ連結する strncat関数
  • 文字列を比較する strcmp関数
  • 文字列を指定された文字数だけ比較する strncmp関数

詳しい使い方は、教科書8.3節に載っていますが、この授業の範囲外なので、ここでは説明を省きます。

#include <stdio.h>
#include <string.h>

int main(void) {
  char s[16] = "ABC";
  char t[16];
  int len;

  len = strlen(s);  // 文字列sの長さを調べる
  printf(">> %d\n", len);

  strcpy(t, s);  // 文字列sを文字列tにコピー(代入)する
  printf(">> %s\n", t);

  strncpy(t, s, 2);  // 文字列sを文字列tに先頭から最大2文字までコピー(代入)する
  printf(">> %s\n", t);

  strcat(s, "DEF");  // 文字列sの後ろに文字列"DEF"を連結する
  printf(">> %s\n", s);

  strncat(s, "GHI", 2);  // 文字列sの後ろに文字列"GHI"のうち先頭から最大2文字まで連結する
  printf(">> %s\n", s);

  if (strcmp(s, "ABCDEFGH") == 0) { // 文字列sと文字列"ABCDEFGH"を比較する
    printf(">> 同じ\n");
  } else {
    printf(">> 同じでない\n");
  }

  if (strcmp(s, "ABCXYZ", 3) == 0) { // 文字列sと文字列"ABCXYZ"を先頭から最大3文字まで比較する
    printf(">> 同じ\n");
  } else {
    printf(">> 同じでない\n");
  }

  return 0;
}

まとめ

文字列文字の配列、つまり、char型の配列です。

文字列の最後にはナル文字 \0 が付けられ、配列の途中であっても \0 があればそこで文字列は終わりとして扱われます。

文字列を入出力するときの変換指定子は %s です。 ただし、scanf関数で指定する変数の前にアンパサンド & を付けません

関数の中では配列の長さを調べることができないため、配列を引数として関数に渡すときは配列の長さも一緒に渡す必要がありますが、文字列の最後はナル文字 \0 であるため、文字列を引数として関数に渡すときは文字列の長さを一緒に渡す必要はありません

練習問題

練習問題はこちら

トップ   編集 凍結解除 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS