Qin Blog

TODO 2023

发表于2023-01-01|TODO

TODO 2023工作学习

发表于2020-02-27|Python

python100例 Python 练习实例1 1234'''题目：有四个数字：1、2、3、4，能组成多少个互不相同且无重复数字的三位数？各是多少？''' Python 练习实例2 123'''题目：''' Python 练习实例3 123'''题目：''' Python 练习实例4 123'''题目：''' Python 练习实例5 123'''题目：''' Python 练习实例6 123'''题目：''' Python 练习实例7 123'''题目：''' Python 练习实例8 123''' ...

Python 110道基础笔试题

发表于2020-02-27|面试题

python110道基础面试题1.一行代码实现1-100之和1print(sum(range(1, 101))) 2.如何在一个函数内部修改全局变量123456789#利用global修改全局变量 a = 5def fun(): global a a=3 fun()print(a) 3.列出5个python标准库12345#os:操作系统相关的函数#re:正则匹配#datetime: 处理日期操作#math:数学运算#sys:处理日期时间 4.字典如何删除键和合并两个字典 del和update方法 1234567dict1={'name':'username', 'age':18}del dict1['name']#删除键print(dict) dict2={'name':'ls'}dict1.update(dict2)print(dict1) #合并两个字典 5.谈下python的 ...

算法岗面试题

发表于2020-02-27|面试题

深信服算法岗选择自己觉得做的最好的项目从需求、样本、特征工程、模型选择等进行项目介绍模型融合的优势以及方法。优势：随着集成中个体分类器数目T 的增大，集成的错误率将指数级下降，最终趋向于零。方法（基学习器是否存在强依赖）：bagging（优化方差），boosting（优化偏差），stacking，blending 会哪些机器学习算法：决策树，朴素贝叶斯分类，最小二乘法，逻辑回归，支持向量机，集成方法；聚类算法，主成分分析，奇异值分解，独立成分分析， LR和SVM的区别：都是分类算法；若不考虑核函数，分类决策面都是线性的；都是监督学习算法；都是判别模型区别： 1）损失函数不同，LR损失函数，SVM损失函数 2） SVM 只考虑局部的边界线附近的点，LR 考虑全局，远离的点对边界线的确定也起作用 3）在解决非线性问题时，SVM 采用核函数的机制，而 LR 通常不采用核函数的方法 4）线性 SVM 依赖数据表达的距离测度，所以需要先对数据做 normalization, LR 则不受影响。 5） SVM损失函数自带正则。LR需要添加正则项白样本多，黑样本少，选择哪个模型 ...

python面试

发表于2020-02-27|面试题

python面试整理常见面试题1.自我介绍（专业技术+项目经验）2.自己做过的项目中遇到过印象最深（难度最高）的问题，要求详细具体阐述（难点突出）3.Python的内存管理机制和垃圾清理机制4.MySQL数据库如何插入或修改一个字段5.Python2和Python3的区别6.Python3是用什么编码的，Python3转码的函数7.Nginx如何用一个IP部署服务器8.列举列表和字典中的所有方法9.如何利用js写多线程10.Django如何实现一个页面的跳转11.socket编程有哪几种方式，具体如何实现的12.这里有一支笔，请列举这支笔的10种用途熟悉PyQt 框架熟悉numpy pandas matplotlib 数学工具库 mysql事务优化秒杀 redis web 网络访问效率 Django屏蔽用户多次恶心请求获取密码后登录django后台处理 python装饰器 nginx Django和flask 对比 Python可变与不可变类型区别，都有哪些类型（5’）可变类型：列表list，字典tuple不可变类型：数字，字符串，元祖 Pyt ...

HTTP常用的默认端口号

发表于2020-02-27

HTTP常用的默认端口号 ⑴. HTTP协议代理服务器常用端口号：80/8080/3128/8081/9080 ⑵. SOCKS代理协议服务器常用端口号：1080 ⑶. FTP（文件传输）协议代理服务器常用端口号：21 ⑷. Telnet（远程登录）协议代理服务器常用端口：23 HTTP服务器，默认的端口号为80/tcp（木马Executor开放此端口）； HTTPS（securely transferring web pages）服务器，默认的端口号为443/tcp 443/udp； Telnet（不安全的文本传送），默认端口号为23/tcp（木马Tiny Telnet Server所开放的端口）； FTP，默认的端口号为21/tcp（木马Doly Trojan、Fore、Invisible FTP、WebEx、WinCrash和Blade Runner所开放的端口）； TFTP（Trivial File Transfer Protocol），默认的端口号为69/udp； SSH（安全登录）、SCP（文件传输）、端口重定向，默认的端口号为22/tcp； S ...

Docker容器使用

发表于2020-02-27

Docker 架构Docker 包括三个基本概念: - 镜像（Image） : 相当于一个root文件系统。 - 容器 (Container)：容器是镜像运行时的实体。容器可以被创建，启动，停止，删除，暂停等。 - 仓库 (Repository)：仓库可以看成是代码控制中心，用来保存镜像 Ubuntu Docker 安装Docker 使用Docker Hello World. docker运行 12#使用docker run命令赖在容器内运行一个应用程序。docker run ubuntu:15.10 /bin/echo "Hello World" 运行交互式的容器，docker 通过两个参数 -i -t 实现对运行的容易进行对话 123docker run -i -t ubuntu:15.10 /bin/bash-t: terminal 在新容器内指定一个伪终端或终端-i: input 允许你对新容器内的标准输入（STDIN）进行交互启动容器（后台模式） 12docker run -d ubuntu:15.10 /bin/sh -c &qu ...

Ubuntu下安装FastDFS并配置Nginx

发表于2020-02-27|Ubuntu

Ubuntu下安装FastDFS并配置Nginx1. 压缩包下载 github下载: fastdfs-5.11.zip github下载: fastdfs-nginx-module github下载: libfastcommon 123wget https://github.com/happyfish100/fastdfs/archive/V5.11.tar.gzwget https://github.com/happyfish100/libfastcommon/archive/V1.0.36.tar.gzwget https://github.com/libevent/libevent/releases/download/release-2.1.12-stable/libevent-2.1.12-stable.tar.gz 2. 环境配置2.1 依赖1234567891011121314151617181920apt-get install makeapt-get install unzipapt-get install gccapt-get install libevent-d ...

第4章解析库的使用

发表于2020-01-28|Book

第4章解析库的使用4.1 XPath的使用XPath，全称XML Path Language，即XML路径语言，是一门在XML文档中查找信息的语言。在做爬虫时，可以使用XPath来做响应的信息抽取，本节介绍XPath的基本用法。 4.1.1 XPath概览4.1.2 XPath常用规则表达式描述 nodename 选取此节点的所有子节点 / 从当前节点选取直接子节点 // 从当前节点选取子孙节点 . 选取当前节点 .. 选取当前节点的父节点 @ 选取属性 4.1.3 准备工作4.1.4 实例引入4.1.5 所有节点4.1.6 子节点4.1.7 父节点4.1.8 属性匹配4.1.9 文本获取4.1.10 属性获取4.1.11 属性多值匹配4.1.12 多属性匹配4.1.13 按序选择4.1.14 节点轴选择4.1.15 结语4.2 使用BeautifulSoup4.2.1 BeautifulSoup简介BeautifulSoup就是一个Python中的一个HTML或XML的及解析库，方面从网页提取数据。 4.2.2 准备工作安装BeautifulS ...

第2章爬虫基础

发表于2020-01-28|Book

第2章爬虫基础2.1 HTTP基本原理2.1.1 URI和URLURI：URL： 2.1.2 超文本2.1.3 HTTP和HTTPS2.1.4 HTTP请求过程2.1.5 请求2.1.6 响应2.2 网页基础2.2.1 网页的组成2.2.2 网页的结构2.2.3 节点树及节点间的关系2.2.4 选择器2.3 爬虫的基本原理2.3.1 爬虫概述2.3.2 能抓怎样的数据2.3.3 JavaScript渲染页面2.4 会话和Cookies2.4.1 静态网页和动态网页2.4.2 无状态HTTP2.4.3 常见误区2.4.4 参考资料2.5 代理的基本原理92.5.1 基本原理2.5.2 代理的作用2.5.3 爬虫代理2.5.4 代理分类2.5.5 常见代理设置2.5.6 参考来源