数据分析实战—食物营养信息
数字素养:学会基本的数据分析和信息安全 #生活常识# #职场技巧# #网络素养#
1.实战内容
import pandas as pd
import json
db = json.load(open('foods-2011-10-03.json'))
print(type(db))
print(type(db[0]))
print(type(db[0]['nutrients']))
print(len(db[0]['nutrients']))
print(type(db[0]['nutrients'][0]))
print('数据集的记录数为:',len(db))
print('数据集的全部属性为:',db[0].keys())
info_keys = ['description', 'group', 'id', 'manufacturer']
info = pd.DataFrame(db, columns=info_keys)
print('食物信息:\n',info.head())
print('食物类别分布信息:\n',pd.value_counts(info.group))
info.head()
xx=info['group']
xx1=xx.drop_duplicates(keep='first')
print('种类个数:',xx1.count())
print(xx1)
nutrients = []
for rec in db:
fnuts =pd.DataFrame(rec['nutrients'])
fnuts['id'] = rec['id']
nutrients.append(fnuts)
nutrients_all=pd.concat(nutrients, ignore_index=True)
nutrients_all
pd.value_counts(nutrients_all.description)
pd.value_counts(nutrients_all.group)
print(nutrients_all.duplicated().sum())
nutrients_new = nutrients_all.drop_duplicates()
print(nutrients_new)
col_mapping = {'description' : 'food','group' : 'fgroup'}
info = info.rename(columns=col_mapping, copy=False)
print('info信息\n',info)
col_mapping = {'description' : 'nutrient','group' : 'nutgroup'}
nutrients_new = nutrients_new.rename(columns=col_mapping, copy=False)
print('营养信息\n',nutrients_new)
ndata = pd.merge(nutrients_new, info, on='id', how='outer')
print('合并信息\n',ndata)
2.数据集下载
https://gitee.com/qxh200000/c_-code/commit/ca6f117a3d02a1e3195bc2d742be86eb901c7e22
网址:数据分析实战—食物营养信息 https://www.yuejiaxmz.com/news/view/571203
相关内容
毕业设计 大数据食物营养数据分析可视化系统(源码+论文)Python数据分析实战
毕业设计项目 大数据食物营养数据分析可视化系统(源码+论文)
计算机毕业设计之基于大数据的食物营养可视化分析系统
食物营养查询和分析系统
javaweb食物营养查询和分析系统
人工智能实践——Restauraut+ 食物识别分析与营养规划系统
从零开始的游戏运营数据分析生活?如何构建数据分析的逻辑框架?
数据分析实战:利用python对心脏病数据集进行分析
食物营养分析