元データ〜表の作成
元データ
この年6月の販売担当部員の売上を集計したものです(単位:円)。
小さな値から順に並べる
「売上」データを昇順に並べ替えます。「売上」の任意のデータを選択し、リボンのデータタブ →並べ替えとフィルタグループにある昇順ボタンをクリックします。
表の基部をつくる
セルC1から右に累積人数累積相対人数累積売上累積相対売上累積均等売上累積相対均等売上の順に6個の見出しを作成します。
見出しとデータの間に新しい行を挿入し、「累積人数」から「累積相対均等売上」列のすべてに0(ゼロ)を入力します。ローレンツ曲線を原点から引くために必要な行です。
「人の数」を積み上げる
「累積相対人数」は、"人の数"に関して、当該行時点での累積値の全体に占める割合を示すものです。
「累積人数」列にリストの24人分の値を連続データで作成します。
- CELL C3=SEQUENCE(24, 1)
「累積相対人数」列に、
累積人数÷総人数
となる式を配置します。セルD3に
- CELL D3=C3/$C$26
と入力します。「総人数」にあたるセル(ここではC26)はコピーを考慮して絶対参照にします。この式を表の最下行までコピーし、パーセントスタイルを適用します。
- CELL D3=C3#/C26
と入力します。あわせてこの列にパーセントスタイルを適用しておきます。
「金額」を積み上げる
「累積相対売上」は、"売上"に関して、当該行時点での累積値の全体に占める割合を示すものです。
「累積売上」列に、先頭行は「売上」の先頭データを参照する式を、次行以降は
直前の累積売上+当該行の売上
となる式を配置します。セルE3に
- CELL E3=B3
と、セルE4に
- CELL E4=E3+B4
と入力し、E4の計算式だけを表の最下行までコピーします。
ある程度の練度があれば、CELL E3=SUM($B$3:B3)
を最下行までコピーした方がスマートです。
「累積相対売上」列に、
当該行の累積売上÷総売上
となる式を配置します。セルF3に
- CELL F3=E3/$E$26
と入力します。この式を表の最下行までコピーし、パーセントスタイルを適用しておきます。
- CELL F3=E3:E26/E26
と入力します。あわせてこの列にパーセントスタイルを適用しておきます。
差はないと仮定して再度「金額」を積み上げる
「均等所得線」「均等分配線」などと呼ばれる、一定の傾き(グラフが正方の場合は45°)をもつ直線をグラフに描画するための列です。ここでは「均等売上線」と呼びます。
「累積均等売上」列に、総売上から平均売上を求め累積値として表示する式を配置します。
総売上÷総人数×当該行の累積人数
セルG3に
- CELL G3=$E$26/$C$26*C3
と入力し、この式を表の最下行までコピーします。
- CELL G3=E26/C26*C3#
「累積相対均等売上」列に、
当該行の累積均等売上÷総売上
となる式を配置します。セルH3に
- CELL H3=G3/$G$26
と入力します。この式を表の最下行までコピーし、パーセントスタイルを適用します。「累積相対均等売上」列の値は「累積相対人数」列と一致するはずです。
- CELL H3=G3#/G26
と入力します。パーセントスタイルを適用しておきます。「累積相対均等売上」列の値は「累積相対人数」列と一致するはずです。
「散布図」を使ってローレンツ曲線その他を図示する
グラフ化に必要なデータは「累積相対人数」列、「累積相対売上」列、および「累積相対均等売上」列の3つです。下のハイライトの領域を選択しておきます。
リボンの挿入タブ →グラフグループにある 散布図(X, Y)またはバブルチャートの挿入 ボタンをクリックし、プルダウンから散布図(直線とマーカー)を選択します。
グラフが作成されました。横軸は「相対人数(人数の累積比)」、縦軸は「相対売上(売上の累積比)」です。青線がローレンツ曲線、オレンジの線が均等売上線です。
グラフを以下の点で調整します。
- 縦・横軸とも最小値 → 0、最大値 → 1
- プロットエリア → 枠線を作成、目盛線削除、できるだけ正方に
- 両軸の表示形式 → パーセント(未適用の場合)
- 系列「累積相対売上」を最前面に移動(系列の順序設定)
「図形の面積」について考える
グラフの中の2つの図形に注目します。
ジニ係数は
赤の面積÷青の面積
で求めることができます。全体を1としたとき(タテ100%×ヨコ100%=1)、青の面積はその半分なので0.5とすぐわかりますが、赤の面積は直接計算できません。
参考として、青の面積が0.5という点に着目すれば、ジニ係数は赤の面積の2倍と等しくなることがわかります(上の式の分子分母にそれぞれ2を掛けると導出できます)。ここでは先の式を使用します。
赤の面積を直接計算するのはやや難しいため、図の手続きで計算します。
青の三角形の面積は0.5と判明していますので、
部分(ローレンツ曲線下方)の面積が計算できればOKです。なお、工程の序盤で「0」の行を挿入したのはこの面積計算をゼロから始めるためでもあります。
ローレンツ曲線下方の領域は、下の図のように多数の台形に分解して考えることができます。1つ1つの台形の面積を求め合算する方法で計算できます(cf. 積分)。
より忠実には、グラフにいう左端の「台形」は三角形です。
台形の面積を求める公式
- (上底+下底)×高さ÷2
の各要素を、ここで扱う台形にあてはめます。
台形の相対人数をあらわす横軸について、左下の角を\(P_n\)、右下の角を\(P_{n+1}\)とし、対応する相対売上をそれぞれ\(V_{P_n}\)、\(V_{P_{n+1}}\)とすると、公式の各要素との対応は次のようになります。
- [上底] \(V_{P_n}\)
- [下底] \(V_{P_{n+1}}\)
- [高さ] \(P_{n+1}-P_{n}\)
ジニ係数を求める
表の右に台形の面積の見出しを用意し、見出しの直下のセルに0(ゼロ)を入力しておきます。
公式に当てはまるよう計算式を組み立てます。セルI3に
- CELL I3=(F2+F3)*(D3-D2)/2
と入力し、これを表の最下行までコピーします。
個々の台形の面積を合計すると、
部分(ローレンツ曲線下方)の面積が求まります。
赤の面積は 0.5 − 0.41 = 0.09 と計算できました。
ジニ係数は「赤の面積÷青の面積」ですので、0.09 ÷ 0.5 = 0.18 と求められます。
ローレンツ曲線の描画、およびジニ係数の計算、完了です。