标签:似然 机器 python 样本 学习 x2 x1 一万个
机器学习
数据挖掘、CV、NLP、语音识别、统计学习、模式识别
套路:1.数据收集处理;2.特征选择与模型构建;3.评估与预测
站点:kaggle github
python库
科学计算库numpy
线性回归
例子:工资x1、年龄x2、贷款额度y关系关系:;
预测一个值,这个值有区间。工资和年龄是特征;贷款额度是目标或者标签;
拟合一个面分割的过程;y= a+b*x1+c*x2;a偏置参数对结果影响小;bc权重参数,对结果影响大。
真实值y与预测值y'的误差;一万个样本一万个,这些误差满足:独立同分布,均值0方差为~的高斯分析。
独立即两个贷款人样本不相关。
同分布即都来同一个银行贷款。
高斯分布即贷款浮动满足正太分布,浮动不会大。
似然函数:乘积,用来根据样本数据估计参数值。
最大似然估计:似然函数越大越好----预测值成为真实值的可能性。
标签:似然,机器,python,样本,学习,x2,x1,一万个 来源: https://blog.csdn.net/qq_22424571/article/details/118863858
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。