technology プログラミング

【初心者向け】Pythonの基礎①

本記事では、Jupyter Notebookを使ってPythonにおいて文字列型、リスト型、辞書型の基本的な使い方についてご紹介します。

Jupyter Notebookは、Safariなどのインターネットブラウザ上でコードを実行できるソフトウェアです。Python以外にもRやJuliaなど様々なプログラミング言語を利用できます。データ分析やデータ可視化、機械学習などに広く活用されています。

Jupyter Notebookのインストール

Jupyter Notebookを含むパッケージをインストールします。

今回は、venvでenvという名前の仮想環境を作成してpipコマンドでインストールします。

仮想環境の構築については、こちらをご覧ください。

Pythonのインストール|venvで仮想環境の構築方法

Jupyter Notebookはpipコマンドでインストールします。

(env)$ pip install jupyter

インストール後に以下のコマンドでJupyter Notebookを起動します。

(env)$ jupyter notebook

 

Jupyter Notebookの利用

Jupyter Notebookの基本的な使い方のご紹介をします。

ログインすると以下の画面になります。

Jupyter Notebookでプログラムを記述するにはnotebookと呼ばれるファイルが必要です。

まずはnotebookを準備します。

作成が完了するとNotebookの画面が開きます。なお、Notebookを編集すると自動的に保存されます。

 

 

Jupyter Notebookのショートカット機能

Jupyter Notebookでは、メニュー欄からコードの追加「+マーク」や実行「▷マーク」などできますが、ここでは5つのショートカット機能についてご紹介します。

1.セルの実行

セル内にprint("Hello World")と入力し「Shift」+「Enter」キーでセル内のプログラムを実行できます。

2.セルの追加

escキーを押してカーソルが外れた状態にします(セルが青くなります)

カーソルが外れた状態でキーボードの「B」を押すとセルが追加されます。

3.セルの削除

カーソルが外れた状態でキーボードの「D」を2回押すとセルが削除されます。

4.Markdownセルの切り替え

カーソルが外れた状態でキーボードの「M」を押すと「コード」から「Markdown」に切り替わります。

マークダウン形式ではプログラムを記述することはできません。

「Shift」+「Enter」キーで実行すると以下のように出力されます。

5.コードセルに切り替え

カーソルが外れた状態でキーボードの「Y」を押すと「Markdown」から「コード」に切り替わります。

Pythonの基礎

文字列型(string)

Pythonではダブルクォート(" ")、シングルダブルクォート(' ')で囲った部分を文字列(文字情報)として扱います。

このように「'」または「"」で囲んでも同様に文字列として認識されます。このような「'」または「"」記号を文字列リテラルと呼びます。print関数を使うと文字列リテラルを省略されて出力されます。

次に文字列を操作する方法をいくつかご紹介します。

  • upper()lower()title()

文字列の大文字小文字を変換します。

  • strip()

左右の空白文字を削除します。

  • len()

len()関数は、文字列の文字数を調べることができます。

len(文字数を数えたい文字列を入力する)

  • format()

文字列の中に別の文字列を持ってきて埋め込むことができます。

  • split()

文字列に含まれる任意の文字を区切り文字として指定することができ、文字列を区切ることができます。

スペースが間に入っている文字列の場合は、スペースの部分で区切って文字列が出力されます。

  • join()

join()メソッドは、リストの中に格納された個々の文字列を連結して1つの文字列にまとめます。

文字列.join(文字列リスト)

  • replace()

指定した文字列を別の文字列に書き換えることができます。

対象文字列.replace(書き換える文字列、書き換え後の文字列、書き換える回数)

  • find()

指定した文字列のインデックス番号(データの順番を表す数値)を調べることができます。

  • isdigit()

文字列が数値の文字列なのかを調べます。

  • bool型 条件演算子

文字列の中に任意の文字列が存在するかを確認します。

リスト型(list)

リスト型は、複数のデータを並べた集まりを示す型です。[ ]角括弧の中に文字列を「,」カンマで区切り、数値や文字列などを並べて作ります。リストは変更可能(ミュータブル)な任意のデータの順番付きデータ集合のため、あとからデータの一部を変更することができます。

[ ]の中のデータを要素と呼びます。リストの要素の順序は維持されるので、インデックス番号(文字の位置を示す数値)を[ ]で囲んで指定することで各要素にアクセスできます。

インデックスは、文字列の先頭を「0」として数えます。2番目を「1」、3番目を「2」と続きます。

  • append()

新しい要素を追加するときは、appendを使います。

  • insert()

指定した位置に要素を追加します。

appendは末尾にしか要素を追加することはできませんが、insertは任意の位置に要素を追加できます。

  • remove()

削除したい要素を指定して削除できます。

  • pop()

インデックス番号を指定することで削除したい要素を削除できます。引数を指定しない場合は、末尾から削除されます。

pop(0)にすると先頭の要素が削除されます。

  • index()

値を指定して要素のインデックスを知ることができます。

  • sort()

要素の並べ替えを行います。

アルファベット順、五十音順で並べ替えることができます。なお、引数に「reverse=True」を指定することで降順に並べ替えることができます。

辞書型(dict)

辞書型は、リストと同じように1つの変数の中に、複数のデータを持つことができます。キー(key)と値(value)のペアの集合で、そのペアのデータに順序はありません。

リストと辞書型の違いは、データの取り出し方にあります。リストではインデックス番号を指定してデータを取り出していましたが、辞書型ではキーを指定してデータを出し入れすることができます。

辞書を定義する際は、キーと値をコロン「:」で区切り、波括弧{ }で囲います。キーに対応する値を取得するには、角括弧[ ]でキーを指定して取得します。また、定義されていない値を指定した場合はKeyErrorが発生します。

まとめ

今回は、Jupyter Notebookを使ってPythonにおいて文字列型、リスト型、辞書型の基本的な使い方についてご紹介しました。

リスト型、辞書型は、データ処理を使う上で欠かせないので、コードを書き換えたりしながら仕組みを理解すると良いでしょう。

-technology, プログラミング

© 2023 KENTECH