来源:佛山达内IT教育
时间: 2024/4/2 11:44:30
IT培训选达内,21年专业IT培训机构,美国上市集团。开设IT培训班Java、python、大数据、linux、UI、会计等IT培训,泛IT培训和非IT培训共2课程、室内设计师、PHP工程师、平面++工程师、SEM竞价师、SEO优化师、社会化媒体运营师、电商运营师等课程为一体的IT培训机构。以下5家IT培训培训机构均已经受过学生的考验,不分前后,值得推荐!
1.佛山达内教育
2.佛山博为峰教育
3.佛山中公教育优就业
4.佛山CDA数据分析师分院
5.佛山北大青鸟
6.佛山信盈达
7.佛山千锋教育
8.佛山传智教育
9.佛山黑马程序员
10.佛山斯坦星球
众所周知,Pandas是基于Python平台的大数据分析与处理的利器。在数据为王的时代,想要掌握数据分析能力,学会Pandas数据可视化工具是十分重要的。本文将带领大家一步一步学习Pandas数据可视化基础绘图,内容比较基础,相信有一定Python基础的小伙伴看完可以很快上手,现在就让我们一起来看看教程吧!
1、环境
IDE : jupyter notebook
Anaconda 3.X
2、基于matplotlib
import matplotlib.pyplot as plt
注:导入matplotlib.pyplot
import matplotlib
matplotlib.style.use('ggplot')
%matplotlib inline
注:使用ggplot样式,并且将图画在jupyter notebook中
import pandas as pd
import numpy as np
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000))
ts.plot()
注:使用pandas创建一个Series(序列),序列值是随机生成的1000个标准正态分布值,索引是从2000-1-1开始的1000个时间序列值。
然后使用plot默认画图。可以看出,下图非常不规则,因为相邻的两个值也是随机大小。
import pandas as pd
import numpy as np
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000))
ts = ts.cumsum()
ts.plot()
注:这里加上了ts = ts.cumsum(),意思是返回累积值,在时间序列分析中,经常观察累积值曲线观察走势这个累积值就看起来规则多了。
df = pd.DataFrame(np.random.randn(1000, 4), index=ts.index, columns=list('ABCD'))
df = df.cumsum()
plt.figure()
df.plot()
注:这里使用pandas创建了一个DataFrame(数据框,有点像excel表格那种),为什么不用刚才的Series呢?因为这里DataFrame中创建了4组数据,这4组数据都是随机生成的1000个标准正态分布值,索引是从2000-1-1开始的1000个时间序列值,并且也是求他们各自的累积值并且画图。
df3 = pd.DataFrame(np.random.randn(1000, 2), columns=['B', 'C']).cumsum()
df3['A'] = pd.Series(list(range(len(df))))
df3.plot(x='A', y='B')
注:使用DataFrame创建了2组数据,也是1000个标准正态分布,分别命名为B、C(就行excel中列名)。并且求累积值,再在原来的df(DataFrame的简称)(这里名字是df3)上加上一列名为A,A的值是0-999(使用df3的长度为1000,然后range被套列表生成一列数,作为x轴),y轴是B列数据(累积值),c列数据较后绘图没有用上。
较后Pandas基础绘图plot就完成了!