モデル作成の概要

モデルは、一連の入力フィールドまたは変数に基づいて結果を予測するために使用できるルール、式、または方程式のセットです。例えば、金融機関はモデルを使用して、過去の申請者に関する既知の情報に基づき、融資申請者のリスクが低いか高いかを予測することができます。

結果を予測できるようになることが、予測分析の主な目標であり、モデル作成プロセスを理解することは、IBM® SPSS® Modeler を使用する上での鍵となります。

図 1. 簡単なデシジョン ツリー モデル
簡単なデシジョン ツリー モデル

この例では、デシジョン ツリー モデルを使用します。このモデルは、一連のデシジョン ルールを使用してレコードを分類します (また、レスポンスを予測します)。以下に例を示します。

IF income = Medium 
AND cards <5
THEN -> 'Good'

この例では、CHAID (カイ 2 乗自動相互検出) モデルを使用しますが、一般的な概要を説明するためにこれを使用しており、ほとんどの概念は IBM SPSS Modeler の他のモデル・タイプにも広く適用されます。

モデルを理解するには、まずそれに入力するデータを理解する必要があります。この例のデータには、銀行の顧客に関する情報が含まれます。次のフィールドが使用されています。

フィールド名 説明
Credit_rating 信用格付け: 0=悪い、1=良い、9=欠損値
Age 年齢
Income 収入レベル: 1=低、2=中、3=高
Credit_cards 所有するクレジット・カード数: 1=5 枚未満、2=5 枚以上
Education 学歴: 1=高校、2=大学
Car_loans 利用中のカー・ローン数: 1=1 件以下、2=2 件以上

銀行は、ローンを返済したか (信用格付け = 良い) 返済していないか (信用格付け = 悪い) ということを含めて、銀行から融資を受けている顧客に関する履歴情報のデータベースを管理します。この既存データを使用して、銀行は今後の融資申請者が債務不履行となる可能性がどれほど高いかを予測できるモデルを構築する必要があります。

ディシジョン・ツリー・モデルを使用して、顧客の 2 つのグループの特性を分析し、債務不履行の尤度を予測できます。

この例では、Demos フォルダーの streams サブフォルダー内にある modelingintro.str というストリームを使用します。データ・ファイルは tree_credit.sav です。詳細については、Demos フォルダーを参照してください。

では、ストリームを見ていきます。

  1. メインメニューから次の各項目を選択します。

    「ファイル」 > 「ストリームを開く」

  2. 「開く」ダイアログ・ボックスのツールバーの金のナゲット・アイコンをクリックし、Demos フォルダーを選択します。
  3. streams フォルダーをダブルクリックします。
  4. modelingintro.str というファイルをダブルクリックします。

次へ