国勢調査 年齢別人口のきれいなデータ

1980年から2015年までの各国勢調査におけるすべての自治体の年齢各歳別・男女別人口データです。
CSV形式とRDF-Turtle形式の2種類を作成しています。
これらのデータの元となるデータは e-Stat から取得したものですが、当ページの掲載データは、分析に用いる際の利便性を高めるために、すべてのデータセットについて、表彰項目や値の表示形式をきっちり揃える加工を行っています。
e-Statの国勢調査データ を利用したことがある方はご存じかと思いますが、調査の年ごとに、集計方法や表彰項目など、データの持ち方がみごとにバラバラです。 特に時系列比較の分析を行う際には、データ形式を揃えるためのクレンジング処理を行うところから始める必要があり面倒くさいです。 それはe-Statの 統計API から出力されるデータについても同じであり、調査年ごとにプログラムを修正する必要があります。
私は人口統計を使った分析やアプリケーションの作成をしばしば行うことから、その不便さを解消することを目的として、1980年以降の国勢調査の「揃った」データを作成しました。 当ページでその成果物をシェアしますのでどうぞご活用ください。
当ページで公開している各種データは、すべて CC0 です。
これらのデータを活用したアプリ 全国人口ピラミッダー も遊んでみてください。
ご支援のお願い m(__)m
RDF-Turtle形式のデータをRDFグラフデータベースに入れたいのですが、私の立てたサーバーには全然入りきりません。 全部で1億6千万トリプルくらいあります。ビッグデータ好きの奇特な方、データベースに入れていただけませんでしょうか? 期間限定でも構いませんのでよろしくお願いします。 (ご支援いただきましたら頑張って宣伝します!)

データ一覧

CSV形式

Excelで活用したい方もおられるかと思いまして、ぎりぎりExcelで扱えるレコード数(104万行以内)に調整してあります。ただしPCの性能が低いと固まったりしてつらいものがあります。
調査年データファイルサイズ行数データ内容
19801980_ALL.csv120MB約103万
19851985_ALL.csv121MB約104万
19901990_1_sexTotal.csv48MB約40万 性別総数
1990_2_male_female.csv93MB約79万 男女別
19951995_1_sexTotal.csv49MB約41万 性別総数
1995_2_male_female.csv93MB約80万 男女別
20002000_1_sexTotal.csv49MB約41万 性別総数
2000_2_male_female.csv94MB約81万 男女別
2000_3_japanese_sexTotal.csv50MB約41万 性別総数 / 日本人のみ
2000_4_japanese_male_female.csv96MB約80万 男女別 / 日本人のみ
20052005_1_ALL.csv106MB約90万
2005_2_japanese.csv108MB約90万 日本人のみ
20102010_1_ALL.csv88MB約74万
2010_2_japanese.csv90MB約74万 日本人のみ
2010_3_oldMunicipal.csv84MB約65万 旧自治体
2010_4_oldMunicipal_japanese.csv85MB約65万 旧自治体 / 日本人のみ
20152015_1_ALL.csv88MB約74万
2015_2_japanese.csv90MB約74万 日本人のみ
2015_3_oldMunicipal.csv84MB約66万 旧自治体
2015_4_oldMunicipal_japanese.csv86MB約66万 旧自治体 / 日本人のみ
「旧自治体」とは、調査時点において市町村合併等(廃置分合)により消滅している自治体の、もとの領域のことを指します。

RDF-Turtle形式

テキストエディタで開いてみてください。ただしPCのメモリが少ないと開けられない場合があります。
調査年データファイルサイズトリプル数データ内容
1980data1980.ttl494MB約1127万
1985data1985.ttl499MB約1139万
1990data1990.ttl577MB約1317万
1995data1995.ttl581MB約1325万
2000data2000.ttl586MB約1336万
data2000_J.ttl586MB約1331万 日本人のみ
2005data2005.ttl436MB約994万
data2005_J.ttl433MB約984万 日本人のみ
2010data2010.ttl358MB約815万
data2010_J.ttl359MB約815万 日本人のみ
data2010_oldMunicipal.ttl320MB約715万 旧自治体
data2010_J_oldMunicipal.ttl321MB約715万 旧自治体 / 日本人のみ
2015data2015.ttl356MB約811万
data2015_J.ttl357MB約811万 日本人のみ
data2015_oldMunicipal.ttl322MB約720万 旧自治体
data2015_J_oldMunicipal.ttl324MB約720万 旧自治体 / 日本人のみ
「旧自治体」とは、調査時点において市町村合併等(廃置分合)により消滅している自治体の、もとの領域のことを指します。

RDFスキーマ情報

e-Statの 統計LOD のRDFスキーマを活用し統計LODとの互換性を持たせています。詳しくは 統計LOD RDFスキーマ情報 をご参照ください。

Prefix

xsdhttp://www.w3.org/2001/XMLSchema#
rdfhttp://www.w3.org/1999/02/22-rdf-syntax-ns#
rdfshttp://www.w3.org/2000/01/rdf-schema#
dcathttp://www.w3.org/ns/dcat#
owlhttp://www.w3.org/2002/07/owl#
cchttp://creativecommons.org/ns#
dctermshttp://purl.org/dc/terms/
foafhttp://xmlns.com/foaf/0.1/
qbhttp://purl.org/linked-data/cube#
sdmx-dimensionhttp://purl.org/linked-data/sdmx/2009/dimension#
estat-measurehttp://data.e-stat.go.jp/lod/ontology/measure/
estat-attributehttp://data.e-stat.go.jp/lod/ontology/attribute/
estat-attribute-codehttp://data.e-stat.go.jp/lod/ontology/attribute/code/
cd-dimensionhttp://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/
cd-codehttp://data.e-stat.go.jp/lod/ontology/crossDomain/code/
g00200521-dimension-2010http://data.e-stat.go.jp/lod/ontology/g00200521/dimension/2010/
g00200521-code-2010http://data.e-stat.go.jp/lod/ontology/g00200521/code/2010/
sacshttp://data.e-stat.go.jp/lod/terms/sacs#

Vocabulary

vocabularydescriptiondata type
qb:Observation観測値(統計の集計結果の値)のクラスに属することを示す-
cd-dimension:timePeriod国勢調査の調査年xsd:gYear
dcterms:identifier対象地域の地方公共団体コードstring(半角数字5字)
sdmx-dimension:refArea対象地域の名称string(日本語)
dcterms:isPartOf対象地域の上位自治体(都道府県)の地方公共団体コードstring(半角数字5字)
sacs:prefectureLabel対象地域の上位自治体(都道府県)の名称string(日本語)
g00200521-dimension-2010:area 対象地域(全エリアか人口集中地区(DID)か)
全域:g00200521-code-2010:area-all
人口集中地区:g00200521-code-2010:area-did
xsd:anyURI
cd-dimension:nationality 国籍(外国人を含む総数か日本人のみか)
総数(国籍):cd-code:nationality-all
日本人のみ:cd-code:nationality-japan
xsd:anyURI
cd-dimension:sex 性別
総数(男女別):cd-code:sex-all
男:cd-code:sex-male
女:cd-code:sex-female
xsd:anyURI
cd-dimension:age 年齢
総数(年齢):cd-code:age-all
0歳:cd-code:age-0
1歳:cd-code:age-1
2歳:cd-code:age-2
・・・
100歳以上:cd-code:age-over100
不詳:cd-code:age-notReported
xsd:anyURI
estat-measure:population人口の値(単位:人)xsd:decimal

注意事項

このサイトにあるデータは、政府統計総合窓口(e-Stat)のAPI機能を使用して取得したデータをもとに作成したものですが、データの内容は国によって保証されたものではありません。

作者:林 正洋