python面试题大全(一)
注:本面试题来源于网络,转载请注明来自http://www.cnblogs.com/goodhacker/p/3366618.html。
1. (1)python 下多线程的限制以及多进程中传递参数的方式
python 多线程有个全局解释器锁(global interpreter lock),这个锁的意思是任一时间只能有一个线程使用解释器,跟单 cpu 跑多个程序一个意思,大家都是轮着用的,这叫“并发”,不是“并行”。
多进程间共享数据,可以使用 multiprocessing.Value 和 multiprocessing.Array
(2)python 多线程与多进程的区别
-
在 UNIX 平台上,当某个进程终结之后,该进程需要被其父进程调用 wait,否则进程成为僵尸进程 (Zombie)。所以,有必要对每个 Process 对象调用 join()方法 (实际上等同于 wait)。对于多线程来说,由于只有一个进程,所以不存在此必要性。
-
多进程应该避免共享资源。在多线程中,我们可以比较容易地共享资源,比如使用全局变量或者传递参数。在多进程情况下,由于每个进程有自己独立的内存空间,以上方法并不合适。此时我们可以通过共享内存和 Manager 的方法来共享资源。但这样做提高了程序的复杂度,并因为同步的需要而降低了程序的效率。
2.Python 是如何进行内存管理的?
http://developer.51cto.com/art/201007/213585.htm
Python 引用了一个内存池 (memory pool) 机制,即 Pymalloc 机制(malloc:n. 分配内存),用于管理对小块内存的申请和释放
内存池(memory pool)的概念:
当 创建大量消耗小内存的对象时,频繁调用 new/malloc 会导致大量的内存碎片,致使效率降低。内存池的概念就是预先在内存中申请一定数量的,大小相等 的内存块留作备用,当有新的内存需求时,就先从内存池中分配内存给这个需求,不够了之后再申请新的内存。这样做最显著的优势就是能够减少内存碎片,提升效率。
内存池的实现方式有很多,性能和适用范围也不一样。
python 中的内存管理机制——Pymalloc:
python 中的内存管理机制都有两套实现,一套是针对小对象,就是大小小于 256bits 时,pymalloc 会在内存池中申请内存空间;当大于 256bits,则会直接执行 new/malloc 的行为来申请内存空间。
关于释放内存方面,当一个对象的引用计数变为 0 时,python 就会调用它的析构函数。在析构时,也采用了内存池机制,从内存池来的内存会被归还到内存池中,以避免频繁地释放动作。
3. 什么是 lambda 函数?它有什么好处?
http://www.kuqin.com/diveinto_python_document/apihelper_lambda.html
lambda 函数是一个可以接收任意多个参数 (包括可选参数) 并且返回单个表达式值的函数。 lambda 函数不能包含命令,它们所包含的表达式不能超过一个。不要试图向 lambda 函数中塞入太多的东西;如果你需要更复杂的东西,应该定义一个普通函数,然后想让它多长就多长。
4. 如何用 Python 输出一个 Fibonacci 数列?
1 a,b = 0, 1 2 while b<100: 3 print (b), 4 a, b = b, a+b
5. 介绍一下 Python 中 webbrowser 的用法?
webbrowser 模块提供了一个高级接口来显示基于 Web 的文档,大部分情况下只需要简单的调用 open() 方法。
webbrowser 定义了如下的异常:
exception webbrowser.Error, 当浏览器控件发生错误是会抛出这个异常
webbrowser 有以下方法:
webbrowser.open(url[, new=0[, autoraise=1]])
这个方法是在默认的浏览器中显示 url, 如果 new = 0, 那么 url 会在同一个浏览器窗口下打开,如果 new = 1, 会打开一个新的窗口,如果 new = 2, 会打开一个新的 tab, 如果 autoraise = true, 窗口会自动增长。
webbrowser.open_new(url)
在默认浏览器中打开一个新的窗口来显示 url, 否则,在仅有的浏览器窗口中打开 url
webbrowser.open_new_tab(url)
在默认浏览器中当开一个新的 tab 来显示 url, 否则跟 open_new() 一样
webbrowser.get([name]) 根据 name 返回一个浏览器对象,如果 name 为空,则返回默认的浏览器
webbrowser.register(name, construtor[, instance])
注册一个名字为 name 的浏览器,如果这个浏览器类型被注册就可以用 get() 方法来获取。
6. 解释一下 python 的 and-or 语法
http://www.kuqin.com/diveinto_python_document/apihelper_andor.html
与 C 表达式 bool ? a : b 类似,但是 bool and a or b,当 a 为假时,不会象 C 表达式 bool ? a : b 一样工作
应该将 and-or 技巧封装成一个函数:
def choose(bool, a, b): return (bool and [a] or [b])[0]
因为 [a] 是一个非空列表,它永远不会为假。甚至 a 是 0 或 '' 或其它假值,列表 [a] 为真,因为它有一个元素。
7.how do I iterate over a sequence in reverse order
for x in reversed(sequence): ... # do something with x..
如果不是 list, 最通用但是稍慢的解决方案是:
for i in range(len(sequence)-1, -1, -1): x = sequence[i] <do something with x>
8.Python 是如何进行类型转换的?
http://canofy.iteye.com/blog/298263
1 函数 描述 2 int(x [,base]) 将 x 转换为一个整数 3 long(x [,base]) 将 x 转换为一个长整数 4 float(x) 将 x 转换到一个浮点数 5 complex(real [,imag]) 创建一个复数 6 str(x) 将对象 x 转换为字符串 7 repr(x) 将对象 x 转换为表达式字符串 8 eval(str) 用来计算在字符串中的有效 Python 表达式, 并返回一个对象 9 tuple(s) 将序列 s 转换为一个元组 10 list(s) 将序列 s 转换为一个列表 11 chr(x) 将一个整数转换为一个字符 12 unichr(x) 将一个整数转换为 Unicode 字符 13 ord(x) 将一个字符转换为它的整数值 14 hex(x) 将一个整数转换为一个十六进制字符串 15 oct(x) 将一个整数转换为一个八进制字符串
9.Python 里面如何实现 tuple 和 list 的转换?
1 >>> l = tuple(iplist) 2 >>> print l 3 ('217.169.209.2:6666', '192.227.139.106:7808', '110.4.12.170:83', '69.197.132.80:7808', '205.164.41.101:3128', '63.141.249.37:8089', '27.34.142.47:9090') 4 >>> t = list(l) 5 >>> print t 6 ['217.169.209.2:6666', '192.227.139.106:7808', '110.4.12.170:83', '69.197.132.80:7808', '205.164.41.101:3128', '63.141.249.37:8089', '27.34.142.47:9090']
10. 请写出一段 Python 代码实现删除一个 list 里面的重复元素
1 >>> l = [1,1,2,3,4,5,4] 2 >>> list(set(l)) 3 [1, 2, 3, 4, 5] 4 或者 5 d = {} 6 for x in mylist: 7 d[x] = 1 8 mylist = list(d.keys())
11.Python 如何实现单例模式?其他 23 种设计模式 python 如何实现?
1 #使用 __metaclass__(元类)的高级 python 用法 2 class Singleton2(type): 3 def __init__(cls, name, bases, dict): 4 super(Singleton2, cls).__init__(name, bases, dict) 5 cls._instance = None 6 def __call__(cls, *args, **kw): 7 if cls._instance is None: 8 cls._instance = super(Singleton2, cls).__call__(*args, **kw) 9 return cls._instance 10 11 class MyClass3(object): 12 __metaclass__ = Singleton2 13 14 one = MyClass3() 15 two = MyClass3() 16 17 two.a = 3 18 print one.a 19 #3 20 print id(one) 21 #31495472 22 print id(two) 23 #31495472 24 print one == two 25 #True 26 print one is two 27 #True
1 #使用装饰器 (decorator), 2 #这是一种更 pythonic, 更 elegant 的方法, 3 #单例类本身根本不知道自己是单例的, 因为他本身 (自己的代码) 并不是单例的 4 def singleton(cls, *args, **kw): 5 instances = {} 6 def _singleton(): 7 if cls not in instances: 8 instances[cls] = cls(*args, **kw) 9 return instances[cls] 10 return _singleton 11 12 @singleton 13 class MyClass4(object): 14 a = 1 15 def __init__(self, x=0): 16 self.x = x 17 18 one = MyClass4() 19 two = MyClass4() 20 21 two.a = 3 22 print one.a 23 #3 24 print id(one) 25 #29660784 26 print id(two) 27 #29660784 28 print one == two 29 #True 30 print one is two 31 #True 32 one.x = 1 33 print one.x 34 #1 35 print two.x 36 #1
12.Python 里面如何拷贝一个对象?
http://blog.csdn.net/sharkw/article/details/1934090
标准库中的 copy 模块提供了两个方法来实现拷贝. 一个方法是 copy, 它返回和参数包含内容一样的对象.
使用 deepcopy 方法, 对象中的属性也被复制
13. 介绍一下 except 的用法和作用?
Python 的 except 用来捕获所有异常,因为 Python 里面的每次错误都会抛出一个异常,所以每个程序的错误都被当作一个运行时错误。
14.Python 中 pass 语句的作用是什么?
pass 语句什么也不做,一般作为占位符或者创建占位程序,pass 语句不会执行任何操作
15. 如何知道一个 python 对象的类型?
type()
16. 介绍一下 Python 下 range() 函数的用法?
http://docs.python.org/library/functions.html#range
range(start, stop[, step])
17. 如何用 Python 来进行查询和替换一个文本字符串?
可以使用 sub()方法来进行查询和替换,sub 方法的格式为:sub(replacement, string[, count=0])
replacement 是被替换成的文本
string 是需要被替换的文本
count 是一个可选参数,指最大被替换的数量
18.Python 里面 search()和 match() 的区别?
match()函数只检测 RE 是不是在 string 的开始位置匹配,search() 会扫描整个 string 查找匹配, 也就是说 match()只有在 0 位置匹配成功的话才有返回,如果不是开始位置匹配成功的话,match() 就返回 none
19. 用 Python 匹配 HTML tag 的时候,<.*> 和 <.*?> 有什么区别?
前者是贪婪匹配,会从头到尾匹配 <a>xyz</a>,而后者是非贪婪匹配,只匹配到第一个 >。
20.Python 里面如何生成随机数?
import random
random.random()
它会返回一个随机的 0 和 1 之间的浮点数
21. 如何用 Python 来发送邮件?
python 实现发送和接收邮件功能主要用到 poplib 和 smtplib 模块。
poplib 用于接收邮件,而 smtplib 负责发送邮件。
代码如下:
1 #! /usr/bin/env python 2 #coding=utf-8 3 import sys 4 import time 5 import poplib 6 import smtplib 7 #邮件发送函数 8 def send_mail(): 9 try: 10 handle = smtplib.SMTP('smtp.126.com',25) 11 handle.login('XXXX@126.com','**********') 12 msg = 'To: XXXX@qq.com\r\nFrom:XXXX@126.com\r\nSubject:hello\r\n' 13 handle.sendmail('XXXX@126.com','XXXX@qq.com',msg) 14 handle.close() 15 return 1 16 except: 17 return 0 18 #邮件接收函数 19 def accpet_mail(): 20 try: 21 p=poplib.POP3('pop.126.com') 22 p.user('pythontab@126.com') 23 p.pass_('**********') 24 ret = p.stat() #返回一个元组:(邮件数, 邮件尺寸) 25 #p.retr('邮件号码') 方法返回一个元组:(状态信息, 邮件, 邮件尺寸) 26 except poplib.error_proto,e: 27 print "Login failed:",e 28 sys.exit(1) 29 30 #运行当前文件时,执行 sendmail 和 accpet_mail 函数 31 if __name__ == "__main__": 32 send_mail() 33 accpet_mail()
22.Python 如何定义一个函数?
定义函数的格式是: def functionName(arg):
23. 有没有一个工具可以帮助查找 python 的 bug 和进行静态的代码分析?
pycheck pylint
24. 如何在一个 function 里面设置一个全局的变量?
global
25. 有两个序列 a,b,大小都为 n, 序列元素的值任意整形数,无序;
要求:通过交换 a,b 中的元素,使 [序列 a 元素的和] 与[序列 b 元素的和]之间的差最小。
1. 分别计算 a,b 序列的和;
2. 求 a 序列和与 b 序列和的差值的一半,记为 half;
3. 在和值大的序列中找出一个与和值小的序列中的元素 max 的差值最接近 half 的元素,记为 min;
4. 将 max 与 min 互换即可。
26. 如何用 Python 删除一个文件?
使用 os.remove(filename) 或者 os.unlink(filename);
27.Python 如何 copy 一个文件?
shutil 模块有一个 copyfile 函数可以实现文件拷贝
28.python 程序中文输出问题怎么解决?
用 encode 和 decode
如:
1 import os.path 2 import xlrd,sys 3 4 Filename=’/home/tom/Desktop/1234.xls’ 5 if not os.path.isfile(Filename): 6 raise NameError,”%s is not a valid filename”%Filename 7 8 bk=xlrd.open_workbook(Filename) 9 shxrange=range(bk.nsheets) 10 print shxrange 11 12 for x in shxrange: 13 p=bk.sheets()[x].name.encode(‘utf-8′) 14 print p.decode(‘utf-8′)
方法二:
在文件开头加上
1 reload(sys) 2 sys.setdefaultencoding(‘utf8′)
29.python 代码得到列表 list 的交集与差集
交集
1 b1=[1,2,3] 2 b2=[2,3,4] 3 b3 = [val for val in b1 if val in b2] 4 print b3
差集
1 b1=[1,2,3] 2 b2=[2,3,4] 3 b3 = [val for val in b1 if val not in b2] 4 print b3
30. 写一个简单的 python socket 编程
python 编写 server 的步骤:
1.
第一步是创建 socket 对象。调用 socket 构造函数。如:
socket = socket.socket(family, type)
family 参数代表地址家族,可为 AF_INET 或 AF_UNIX。AF_INET 家族包括 Internet 地址,AF_UNIX 家族用于同一台机器上的进程间通信。
type 参数代表套接字类型,可为 SOCK_STREAM(流套接字) 和 SOCK_DGRAM(数据报套接字)。
2.
第二步是将 socket 绑定到指定地址。这是通过 socket 对象的 bind 方法来实现的:
socket.bind(address)
由 AF_INET 所创建的套接字,address 地址必须是一个双元素元组,格式是 (host,port)。host 代表主机,port 代表端口号。如果端口号正在使用、主机名不正确或端口已被保留,bind 方法将引发 socket.error 异常。
3.
第三步是使用 socket 套接字的 listen 方法接收连接请求。
socket.listen(backlog)
backlog 指定最多允许多少个客户连接到服务器。它的值至少为 1。收到连接请求后,这些请求需要排队,如果队列满,就拒绝请求。
4.
第四步是服务器套接字通过 socket 的 accept 方法等待客户请求一个连接。
connection, address = socket.accept()
调用 accept 方法时,socket 会进入“waiting”状态。客户请求连接时,方法建立连接并返回服务器。accept 方法返回一个含有两个元素的元组 (connection,address)。第一个元素 connection 是新的 socket 对象,服务器必须通过它与客户通信;第二个元素 address 是客户的 Internet 地址。
5.
第五步是处理阶段,服务器和客户端通过 send 和 recv 方法通信 (传输 数据)。服务器调用 send,并采用字符串形式向客户发送信息。send 方法返回已发送的字符个数。服务器使用 recv 方法从客户接收信息。调用 recv 时,服务器必须指定一个整数,它对应于可通过本次方法调用来接收的最大数据量。recv 方法在接收数据时会进入“blocked”状态,最后返回一个字符 串,用它表示收到的数据。如果发送的数据量超过了 recv 所允许的,数据会被截短。多余的数据将缓冲于接收端。以后调用 recv 时,多余的数据会从缓冲区 删除 (以及自上次调用 recv 以来,客户可能发送的其它任何数据)。
6. 传输结束,服务器调用 socket 的 close 方法关闭连接。
python 编写 client 的步骤:
1. 创建一个 socket 以连接服务器:socket = socket.socket(family, type)
2. 使用 socket 的 connect 方法连接服务器。对于 AF_INET 家族, 连接格式如下:
socket.connect((host,port) )
host 代表服务器主机名或 IP,port 代表服务器进程所绑定的端口号。如连接成功,客户就可通过套接字与服务器通信,如果连接失败,会引发 socket.error 异常。
3. 处理阶段,客户和服务器将通过 send 方法和 recv 方法通信。
4. 传输结束,客户通过调用 socket 的 close 方法关闭连接。
下面给个简单的例子:
server.py
1 #coding:utf-8 2 3 import socket 4 if __name__ == '__main__': 5 sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) 6 sock.bind(('localhost', 8001)) 7 sock.listen(5) 8 9 while True: 10 connection,address = sock.accept() 11 try: 12 connection.settimeout(5) 13 buf = connection.recv(1024) 14 if buf == '1': 15 connection.send('welcome to server!') 16 else: 17 connection.send('please go out!') 18 except socket.timeout: 19 print 'time out' 20 21 connection.close()
client.py
1 #coding:utf-8 2 3 import socket 4 import time 5 6 if __name__ == '__main__': 7 sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) 8 sock.connect(('localhost', 8001)) 9 time.sleep(2) 10 sock.send('1') 11 print sock.recv(1024) 12 sock.close()
在终端运行 server.py,然后运行 clien.py,会在终端打印“welcome to server!"。
31.python 如何捕获异常
(1)使用 try 和 except 语句来捕获异常
1 try: 2 block 3 except [exception,[data…]]: 4 block 5 6 try: 7 block 8 except [exception,[data...]]: 9 block 10 else: 11 block
捕获到的 IOError 错误的详细原因会被放置在对象 e 中, 然后运行该 python 异常处理的 except 代码块捕获所有的异常
(2)用 raise 语句手工引发一个异常:
1 raise [exception[,data]] 2 3 try: 4 raise MyError #自己抛出一个异常 5 except MyError: 6 print 'a error' 7 8 raise ValueError,’invalid argument’
(3)采用 sys 模块回溯最后的异常
1 import sys 2 try: 3 block 4 except: 5 info=sys.exc_info() 6 print info[0],":",info[1]
32.src = "security/afafsff/?ip=123.4.56.78&id=45",请写一段代码用正则匹配出 ip
匹配 ip 地址的 python 正则表达式
'^([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])$'
故本题答案
1 >>> re.findall(r'([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])', src) 2 [('123', '4', '56', '78')]
33. 写一段代码用 json 数据的处理方式获取 {"persons":[{"name":"yu","age":"23"},{"name":"zhang","age":"34"}]} 这一段 json 中第一个人的名字。
1 json 读取 2 >>> import json 3 >>> j = json.loads('{"persons":[{"name":"yu","age":"23"},{"name":"zhang","age":"34"}]}') 4 >>> print j 5 {u'persons': [{u'age': u'23', u'name': u'yu'}, {u'age': u'34', u'name': u'zhang'}]} 6 >>> print j.keys() 7 [u'persons'] 8 >>> print j.values() 9 [[{u'age': u'23', u'name': u'yu'}, {u'age': u'34', u'name': u'zhang'}]] 10 >>> print j.values()[0] 11 [{u'age': u'23', u'name': u'yu'}, {u'age': u'34', u'name': u'zhang'}] 12 >>> print j.values()[0][0] 13 {u'age': u'23', u'name': u'yu'} 14 >>> print j.values()[0][0]['name'] 15 yu
34. 平衡点问题
平衡点:比如 int[] numbers = {1,3,5,7,8,25,4,20}; 25 前面的总和为 24,25 后面的总和也是 24,25 这个点就是平衡点;假如一个数组中的元素,其前面的部分等于后面的部分,那么这个点的位序就是平衡点
要求:返回任何一个平衡点
使用 sum 函数累加所有的数。
使用一个变量 fore 来累加序列的前部。直到满足条件 fore<(total-number)/2;
python 代码如下:
1 numbers = [1,3,5,7,8,2,4,20] 2 3 #find total 4 total=sum(numbers) 5 6 #find num 7 fore=0 8 for number in numbers: 9 if fore<(total-number)/2 : 10 fore+=number 11 else: 12 break 13 14 #print answer 15 if fore == (total-number)/2 : 16 print number 17 else : 18 print r'not found'
算法简单,而且是 O(n) 的,12 行代码搞定。参考http://blog.renren.com/share/235087438/3004327956
35. 支配点问题:
支配数:数组中某个元素出现的次数大于数组总数的一半时就成为支配数,其所在位序成为支配点;比如 int[] a = {3,3,1,2,3};3 为支配数,0,1,4 分别为支配点;
要求:返回任何一个支配点
1 li = [3,3,1,2,3] 2 def main(): 3 mid = len(li)/2 4 for l in li: 5 count = 0 6 i = 0 7 mark = 0 8 while True: 9 if l == li[i]: 10 count += 1 11 temp = i 12 i += 1 13 if count > mid: 14 mark = temp 15 return (mark,li[mark]) 16 if i > len(li) - 1: 17 break 18 19 if __name__ == "__main__": 20 print main()
36. 什么是 PEP 8
参考:http://www.python.org/dev/peps/pep-0008/
37.Python2.x 和 Python3.x 的区别
从 Python2 到 Python3,很多基本的函数接口变了,甚至是,有些库或函数被去掉了,改名了。
参考:http://www.cnblogs.com/codingmylife/archive/2010/06/06/1752807.html