机器学习入门教程

【答疑】机器学习-入门需要什么基础

作者 : 老饼 发表日期 : 2022-06-09 15:13:53 更新日期 : 2025-03-29 18:55:45
本站原创文章,转载请说明来自《老饼讲解-机器学习》www.bbbdata.com



对于新人在入手机器学习时,往往会因为没接触过机器学习而担心自己基础不足

因此,本文对常见的疑问进行解答,例如需要什么编程基础、数学基础等

通过本文,可以了解机器学习所需要的基础内容,以及在基础不足时应如何克服




     01. 机器学习-需要什么基础     




本节讲解新人上手机器学习时的一些常见疑问





      入手机器学习-需要什么编程语言      


机器学习使用什么语言
用于机器学习的语言有很多,python、R、matlab、SAS、C++等,但现在基本都用python,
用python最大的好处是,包多,开源,用的人多,在众多语言中不算难,建议大家也直接入手python
 使用python的理由如下:
  1. 工作中有时需要统一编程语言        
2. 找资料方便,也更丰富                
 
此外,python可以做的东西很多           
熟悉python以后,用编程处理其它需求也不用重学另一种语言
  
python用什么IDE
如果装原生python,在装完python后还需要装其它机器学习包、ide, 建议直接使用Anaconda
Anaconda是全家桶,各种包直接安装好,自带编程界面Spyder,对机器学习来说,使用Anaconda简单了事
 另外IDEA使用jupyter notebook也是不错的选择,pycharm则面向开发或工程化的项目,机器学习用pycharm的较少
机器学习需要将python学到什么程度
 
对于机器学习,只需要有一般的python基础就够了,
例如数据的处理、if else语句、pandas、numpy的简单使用等等,有一般的python使用经验即可
而对于没有python使用经验,但有其它编码语言(例如matlab,C++等)基础的同学
则只需要把python的基础操作和基础语法简单看一下,再跟随机器学习的教程逐步熟悉即可





     入手机器学习-需要什么数学基础     


机器学习中最常用的基础数学有:
 
1. 高等代数(线性代数)                  
2. 数学分析(微积分)                    
3. 统计与概率                             

 
其中代数比较重要,需要有一定的深刻理解,而数学分析和概率论则只用到个别知识点
如果上述数学内容没学好,学机器学习过程会有些困难,但比较常用的机器学习算法一般涉及的数学内容不难
  老饼认为,前期可以艰难前行,慢慢跟随着机器学习去提升我们的数学水平
在遇到一些较难的算法时,可以先从应用上手,再慢慢学习,遇到不懂的再针对性补习一下就好了
 
总的来说,有一些高中、大学的一般数学基础就可以了,如果基础差,则艰难前行就好,坚持坚持就熟悉了
所以,机器学习并不需要太精深的数学,但前提是,自己有毅力、有自信
如果基础差,一遇到看不懂的,就认为都是自己数学基础差的原因,那就没法学了





      机器学习-要学什么内容      


一般来说,在特定行业中,往往都只用两、三个模型
因此,根据不同行业,需要掌握行业特定的模型,然后作为从业者,也必须了解一些大家公知的模型
同时在学习模型的时候,会涉及一些求解的算法,例如梯度下降、最小二乘法等等
最后是一些通用常识,例如模型的评估、数据的清洗等等,在学习、项目应用的过程同时积累就可以了
 所以核心还是模型,常见的知名度较高的模型如下:
 
回归模型:线性回归、岭回归、Lasso回归                                           
                               分类模型:逻辑回归、决策树、SVM 、集成算法(随机森林、Adboost、GBDT、Xgboost)
                     降维算法:PCA主成份分析、线性判别LDA、因子分析FA、独立成份分析ICA          
 其它算法: KNN、K-means、朴素贝叶斯、隐马可夫链、Apriori等等
 对于入门来说,并不需要全部都要学,有些进行了解就可以了
一些常见的概念常识如下:
 
过拟合、正则化、数据清洗、AUC、KS等等
这些概念一般并不需要特地系统地去学,在实践过程中自然慢慢就会积累了







好了,以上就是机器学习入门的答疑了,以后再适当补充~









 End 




联系老饼