Be Me in Real Life

做自己,笑不羁

最近想重新开始学习Coursera上的Algorithms, Part I课程(之前学了第一周就放弃了),顺便这次从Windows换到Linux平台体验下。

因为几乎完全不熟悉Java, 第一个练习作业就有点懵逼,尤其是jar包相关。我第一次做这个的时候很可能也犯了不少错,但是现在忘了,感觉有必要记录一下。

阅读全文 »

复习

  1. 上一节的内容被称作traingin model, 主要是根据big data set计算获得coefficient的过程;
  2. 可以不懂公式的具体原理,但是要知道每个参数的含义、如何使用算法、用代码实现算法;
  3. 利用SGD随机梯度下降算法计算coef;

这一节课主要讲贝叶斯公式Bayes’ theorem

  • 如何用已知预测未知
  • Prediction Model
    几乎所有模型都是基于训练模型Training Model预测模型Prediction Model,这一节也会使用贝叶斯算法实现这两个模型

Bayes’ theorem and Prediction Model

image.png

阅读全文 »

复习

  1. Finalize持久化,将算法、参数和数据持久化为一个文件
  2. Framework框架,将模型选择的总体流程打包为一个框架
    pipeline管道方式
  3. Dimensionality Reduction降维
    降维使用 PCA 主元分析法,pipeline管道方式作为流水线
  4. frequent item set常用物品组合

今天的内容主要是算法的详细深入讲解,不再是简单调用第三方库,而是完全自己实现用到的算法,这才是真正工作中的场景。

阅读全文 »

复习

对数据进行预处理的方式,注意预处理只改变X而不改变y:

  1. Rescale
  2. standardlize
  3. Normalize
  4. binarize

改进计算准确率accuracy score的方式:

  1. K-fold
    没有考虑到标签分组情况,还不够好
  2. StratifiedKFold

模型选择思路:

  1. 均值看准确率
  2. 标准差看稳定性

更直观的方式:

  1. 箱子图
  2. Confusion Matrix 混淆矩阵/模糊矩阵

今天主要有3个专题:

  1. 将训练好的模型持久化保存
  2. 从数据预处理到算法评估,搭建一整套框架完整这些任务
  3. 对数据进行降维处理
阅读全文 »

复习

预测模型

image.png

评估模型

对多个模型进行选择,基于准确率accuracy score进行。

image.png

其他

都是基于概率论的贝叶斯公式bayes‘ rule。

主干工作是前面的2个模型,后期的工作是研究各个算法(课堂只用了KNN等),拓宽广度为工作服务,但暂时先不必研究深度,后期如果研究透了再研究。

学者一般是只研究理论,而不实践应用。
我们的优势是可以接触生产环境、把理论应用到实践中,然后如果发现问题,如性能问题等,进行优化,就可以研究理论进行优化、发表论文。外国很多人也是这样做的。

在不疑处有疑。 在别人不怀疑的地方怀疑

本节预览Data preprosessing、Model Selection(对评估模型优化)

这节课程主要是这3部分,重点是2和3。

阅读全文 »

前言

这节课是公司“学徒计划”训练营Python课程班的第4节课,前3节课主要讲了web框架(Django和原生方式)、selenium自动化测试工具的使用、网络爬虫(Scrapy和原生方式)。

这节课开始,进入课程的主要内容——机器学习部分。

这节课主要是4类python库的使用:

  1. Numpy 数据处理
  2. Pandas 读取文件
  3. Matplotlib 图形化展示
  4. Scipy高级科学计算库和scikit-learn机器学习库

阅读全文 »

每到晚上就不想睡觉,其实也没啥好玩,甚至感觉玩手机、电脑很无聊,但就是单纯不想睡觉。

前天周五熬夜到3点多快4点,昨晚准备12点睡,结果还是和平时一样熬夜到1点。迷迷糊糊快睡着时突然感觉身体开始颤抖、身体不受控制,好在时间不长,持续了大概一两分钟,最多四、五分钟的样子。

阅读全文 »

最近一段时间在家看coursera看网课,发现有一门课的视频点开就是“Sorry, we are down for maintenance.”,但是这一门课的非视频材料、其他课程的所有材料都正常,而且在公司电脑打开视频页面也完全正常。

阅读全文 »

这种公众号引流的方法越来越普遍了,很烦。与其每次都找到并拿起手机-打开微信-扫码关注-回复获取验证码-回到电脑输入验证码,不如学一下怎么破解,哪怕每次花的时间更久也值得,起码学到了东西。

1

点击下载后出现验证码

阅读全文 »

现在是23年7月中旬,大概是在两年半之前的20年年底,我突发奇想搞了个博客。当时也没想过为什么写、写什么,反正稀里糊涂陆陆续续记录了一些东西,以学习笔记为主。后面开始忙了+热情逐渐消退+没有目标,基本很少更新内容,直到前段时间发现第二个域名即将过期,打算认真思考下博客的定位,养成写作的习惯。


阅读全文 »
0%