モデル作成の概要

モデルは、一連の入力フィールドまたは変数に基づいて結果を予測するために使用できるルール、式、または方程式のセットです。例えば、金融機関はモデルを使用して、過去の申請者に関する既知の情報に基づき、融資申請者のリスクが低いか高いかを予測することができます。

結果を予測できるようになることが、予測分析の主な目標であり、モデル作成プロセスを理解することは、IBM® SPSS® Modeler を使用する上での鍵となります。

この例では、デシジョンツリー モデルを使用します。このモデルは、一連のデシジョンルールを使用してレコードを分類します (また、レスポンスを予測します)。以下に例を示します。

IF income = Medium 
AND cards <5
THEN -> 'Good'

この例では、CHAID (カイ 2 乗自動相互検出) モデルを使用しますが、一般的な概要を説明するためにこれを使用しており、ほとんどの概念は IBM SPSS Modeler の他のモデル・タイプにも広く適用されます。

モデルを理解するには、まずそれに入力するデータを理解する必要があります。この例のデータには、銀行の顧客に関する情報が含まれます。次のフィールドが使用されています。

フィールド名	説明
Credit_rating	信用格付け: 0=悪い、1=良い、9=欠損値
Age	年齢
Income	収入レベル: 1=低、2=中、3=高
Credit_cards	所有するクレジット・カード数: 1=5 枚未満、2=5 枚以上
Education	学歴: 1=高校、2=大学
Car_loans	利用中のカー・ローン数: 1=1 件以下、2=2 件以上

銀行は、ローンを返済したか (信用格付け = 良い) 返済していないか (信用格付け = 悪い) ということを含めて、銀行から融資を受けている顧客に関する履歴情報のデータベースを管理します。この既存データを使用して、銀行は今後の融資申請者が債務不履行となる可能性がどれほど高いかを予測できるモデルを構築する必要があります。

ディシジョン・ツリー・モデルを使用して、顧客の 2 つのグループの特性を分析し、債務不履行の尤度を予測できます。

この例では、Demos フォルダーの streams サブフォルダー内にある modelingintro.str というストリームを使用します。データ・ファイルは tree_credit.sav です。詳細については、Demos フォルダーを参照してください。

では、ストリームを見ていきます。

メインメニューから次の各項目を選択します。
「ファイル」 > 「ストリームを開く」
「開く」ダイアログ・ボックスのツールバーの金のナゲット・アイコンをクリックし、Demos フォルダーを選択します。
streams フォルダーをダブルクリックします。
modelingintro.str というファイルをダブルクリックします。