# python 数据分析学习

# day 1

在这些数据之中隐藏着无数问题的答案,这些问题从没有人提出过


数据科学(英语:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品 [1]。它结合了诸多领域中的理论和技术,包括应用数学统计模式识别机器学习数据可视化数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。 数据科学技术可以帮助我们如何正确的处理数据并协助我们在生物学社会科学人类学等领域进行研究调研。此外,数据科学也对商业竞争有极大的帮助 [2]


用 anaconda 重新安装 python 环境,之后命令行默认使用的是 conda 自带的 python 环境,与原来安装的 python 并不冲突

Anaconda 的环境部署

打开 anaconda 命令行工具

  1. 使用 Ipython(一个 python 的交互式 shell)

  2. 设置清华源可以加速下载包

conda:

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --append channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/fastai/
conda config --append channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda config --append channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
conda config --set show_channel_urls yes

# 使用 conda 设置虚拟环境

conda create -n kr python=3.6 创建 python3.6 环境

conda activate kr 进入虚拟环境

deactivate 离开虚拟环境

conda env list 列出环境

conda env remove -n env_name

# Jupyer Notebook

  • 是一个基于网页的交互式笔记本,支持多种编程语言
  • anaconda 命令行输入 jupter notebook 即可打开
  • 文件会被创建在你打开的目录下

shift+enter 执行代码

第一天结束,摸摸:),主要完成了环境配置与一些书籍收集整理

image-20210327215347531

# day 2

# jupyter 的使用

tab 自动补全

B 键在下方新建代码块,A 在上方

?可以看到函数参数

魔术命令:

%pwd

%matplotlib inline

%timeit

可以远程访问 jupyter

# day3

python 正则表达式

更新于 阅读次数