遥望宇宙的深处,
漆黑,寂静,
如万古长夜,
我们孤独地生存在汪洋宇宙的孤岛上。
记录我的所见、所闻、所学、所得 Email:sunnysean@qq.com
流行病学中的统计模型无法直接考虑因果关系,但另一方面有时可以根据先验知识预设因果关系。所以我们在研究时要区分,哪些讨论是单纯对统计模型而言的,哪些讨论是掺有专业上的先验知识,而哪些讨论是仅在理论上对哲学里因果关系的向往。
在绘图时,最影响美观的是颜色。有时亮丽的色彩适合表达鲜明的主题思想;有时暗淡一点或者简单对比的色彩更让人舒服。颜色样式繁多复杂,反映出图的风格,如人的个性。同作画一样,MATLAB、Python和R自由地绘图时,心中先需要”调制”一个调色板(palette)。
Bio.Entrez可以从NCBI Genbank提取各种信息,包括在线Blast结果的提取。尤其这些过程通过编程实现时,可以很方便的批量自动化获取信息。总结了Bio.Entrez的结构关系如下:
Python,不同于MATLAB和R,本身是一种很灵活的脚本语言。它的编程风格极为自由,也是处理文本很好工具,很适合大数据处理。不断有人给它添加了数据处理的模块,numpy,scipy,pandas,statsmodels等,更使它如虎添翼。sklearn,tensorflow,keras等机器学习模块,让它远远同时超越同类的编程工具和数据处理工具。即便绘图功能也不在话下,如同MATLAB一样简练,超出了我们对脚本语言的认知。
用它的各种统计和机器学习模块处理数据,同时有专业编程功能的神助攻,畅快淋漓!痛快!如此重量级的科研工具,怎能不掌握?
(本文不针对”数据挖掘”的大规模数据。讨论的仍是常见的中通量科研数据的统计分析)
数据分析和可视化软件层出不穷,让人眼花缭乱。傻瓜式的菜单操作给了我们便利,但给我们科研者带来的却是,数据越来越陌生。这些软件仿佛是实验外包公司一样,您对过程产生过怀疑么?我们提供数据,按照标准的规程一步步操作,结论自动呈现在懒人的面前。我不怀疑软件的正确性,我只怀疑使用者是否考虑过模型中的参数设置。