正在加载图片...
In (7]:plt.scatter(edf.EMGINESI2E,cdf.C02ENISSIONS, color-'blue') plt.xlabel("Engine size") p1t,y1ae1('mi881on“) plt.show() 0 430 下面是发动机的汽缸数和二氧化碳排放量之间的关系,可以看到它们之间的 线性关系就非常的弱了。 In [8]:plt.scatter(edf.CYLINDERS,cdf.Co2EMISSIONS, color-'blue') plt.xlabel("Cylinders"l plt.ylabel("Emission') plt.show() 500 450 50 10 下面让我们开始机器学习的过程。首先,我们要将数据集进行划分,其中80% 作为训练集,剩下的数据作为测试集。 创建训练和测试数据集 In 19]:mak np.random.rand(len(df))<0.8 train cdf[nsk] test cdf[-nsk 然后,我们可以先使用简单回归模型来进行预测。例如,我们认为发动机的 尺寸和汽车的二氧化碳排放量存在着关系,我们来预测它们之间的关系。我们首 先再看一看这张图,它基本上是呈线性关系的,我们现在就要找到这条线性关系 的直线,即,线性回归线在哪里?下面是发动机的汽缸数和二氧化碳排放量之间的关系,可以看到它们之间的 线性关系就非常的弱了。 下面让我们开始机器学习的过程。首先,我们要将数据集进行划分,其中 80% 作为训练集,剩下的数据作为测试集。 然后,我们可以先使用简单回归模型来进行预测。例如,我们认为发动机的 尺寸和汽车的二氧化碳排放量存在着关系,我们来预测它们之间的关系。我们首 先再看一看这张图,它基本上是呈线性关系的,我们现在就要找到这条线性关系 的直线,即,线性回归线在哪里?
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有