找回密码
 加入后院

QQ登录

只需一步,快速开始

搜索
查看: 1328|回复: 0

[兼职经验] 腾讯实习招聘面试题-软件开发

[复制链接]
发表于 2011-5-9 11:56 | 显示全部楼层 |阅读模式
腾讯实习招聘面试题-软件开发 + N5 u) H4 V& @# T2 K1 [( p
! x) ~0 A8 O( \( C6 _% A) z" S0 \
, G0 Q8 Q( D! C" W/ S' |
腾讯实习招聘面试题-软件开发
1 }/ Q) `' t) x9 a5 W+ U) C$ m% c3 N& x" E9 l
! k- {/ G+ o4 }3 A$ E+ `
zz
: g4 D, |) w$ ]: T( f# S- ~8 G4 Z. N+ J0 B) R$ ]9 H3 w, `6 d
  y, w7 V: m8 g4 o6 C& ?
大部分是说说你自己的思想:# q) q: c+ ^& \4 n9 a
1,一亿个数中取中位数
' Y" \2 j4 x* K: {  n, p6 T2,一万个手机号有两个重复的,让你找出来6 Q7 o* q/ N- Y  `( d
3,求二叉树中两节点的最长路径- i4 l3 f7 d: j; n4 j; C& V+ e
% N& C) I5 w7 @1 i# c$ g, V
1.有一亿个随机数,不排序如何找出其中位数4 Q+ p4 `- P2 ~/ U; O& p  y
题目:在一个文件中有 10G 个整数,乱序排列,要求找出中位数。内存限制为 2G。只写出思路即可(内存限制为 2G的意思就是,可以使用2G的空间来运行程序,而不考虑这台机器上的其他软件的占用内存)。
5 x$ o) |+ v. z% U% p+ u" a* W$ L8 B$ Y: d' }
关于中位数:数据排序后,位置在最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。中位数的位置:当样本数为奇数时,中位数=(N+1)/2 ; 当样本数为偶数时,中位数为N/2与1+N/2的均值(那么10G个数的中位数,就第5G大的数与第5G+1大的数的均值了)。' k+ F& Z" L* O/ Y
3 v  U4 P* H. h
分析:明显是一道工程性很强的题目,和一般的查找中位数的题目有几点不同。5 s$ h7 I+ G; p1 b0 o+ _- \
1. 原数据不能读进内存,不然可以用快速选择,如果数的范围合适的话还可以考虑桶排序或者计数排序,但这里假设是32位整数,仍有4G种取值,需要一个16G大小的数组来计数。1 r  n0 M1 d% q% K

! ]0 B( p9 B+ o2. 若看成从N个数中找出第K大的数,如果K个数可以读进内存,可以利用最小或最大堆,但这里K=N/2,有5G个数,仍然不能读进内存。
+ U  Q' e" H1 y" o
% \. n' n$ |  q/ U# u3. 接上,对于N个数和K个数都不能一次读进内存的情况,《编程之美》里给出一个方案:设k<K,且k个数可以完全读进内存,那么先构建k个数的堆,先找出第0到k大的数,再扫描一遍数组找出第k+1到2k的数,再扫描直到找出第K个数。虽然每次时间大约是nlog(k),但需要扫描ceil(K/k) 次,这里要扫描5次。
) ~$ X- o2 J( S4 T7 e) y
5 X  r6 c2 [" H( r7 U解法:首先假设是32位无符号整数。
  Y5 ^5 Y& h9 ^5 Q1 J& M8 L% e3 y1. 读一遍10G个整数,把整数映射到256M个区段中,用一个64位无符号整数给每个相应区段记数。
  K8 B8 B- J0 a( {- Z8 L% R( B, A说明:整数范围是0 - 2^32 - 1,一共有4G种取值,映射到256M个区段,则每个区段有16(4G/256M = 16)种值,每16个值算一段, 0~15是第1段,16~31是第2段,……2^32-16 ~2^32-1是第256M段。一个64位无符号整数最大值是0~8G-1,这里先不考虑溢出的情况。总共占用内存256M×8B=2GB。( E1 c( m# g. n. Q! Y! J
5 p$ ?: q  l% r/ `
2. 从前到后对每一段的计数累加,当累加的和超过5G时停止,找出这个区段(即累加停止时达到的区段,也是中位数所在的区段)的数值范围,设为[a,a+15],同时记录累加到前一个区段的总数,设为m。然后,释放除这个区段占用的内存。
6 j1 ?+ h" j/ v; [% Q/ e2 O3 H& ]9 C7 E" x: E- W% H1 J
3. 再读一遍10G个整数,把在[a,a+15]内的每个值计数,即有16个计数。
" z& |# ]1 O3 U6 z% c
' W0 s; l+ e8 {. o' n4. 对新的计数依次累加,每次的和设为n,当m+n的值超过5G时停止,此时的这个计数所对应的数就是中位数。
- M1 s3 Q% x6 p* d- v, `8 |& f/ p, b' l8 |% K
总结:
+ s4 |9 w! x4 }, g1.以上方法只要读两遍整数,对每个整数也只是常数时间的操作,总体来说是线性时间。# U- b( R, T- W6 w

7 J1 A5 k$ H( j) K7 r2. 考虑其他情况。% b/ V' c9 P1 s1 ^) e
若是有符号的整数,只需改变映射即可。若是64为整数,则增加每个区段的范围,那么在第二次读数时,要考虑更多的计数。若过某个计数溢出,那么可认定所在的区段或代表整数为所求,这里只需做好相应的处理。噢,忘了还要找第5G+1大的数了,相信有了以上的成果,找到这个数也不难了吧。$ o2 i: J: w' \; x7 B

9 `1 F$ o% f$ c: @$ }+ T, r* L# G3. 时空权衡。- u$ i4 \$ J. i  r4 c4 ?, H  ~  w2 \
花费256个区段也许只是恰好配合2GB的内存(其实也不是,呵呵)。可以增大区段范围,减少区段数目,节省一些内存,虽然增加第二部分的对单个数值的计数,但第一部分对每个区段的计数加快了(总体改变??待测)。
- T6 {5 B% D8 b8 l# {, j8 M4 y& c) \2 n2 K# m
4. 映射时尽量用位操作,由于每个区段的起点都是2的整数幂,映射起来也很方便。 7 K) C* R7 l8 o. @9 k

, u) e+ ^, _) p0 ?# _2.假设有一个应用程序A,现要设计一个应用程序B来动态 测试A,问如何设计这个软件?- v3 t1 |0 o! N  U( r
3 ^6 k* @9 S0 w4 h6 @8 J
http://bbs.aftjob.com/thread-606762-1-1.html
: \' z: c+ h- e3 k; U1 V1 w
% B& m  p+ Q2 Z——  C( u8 I0 ~/ @' ]8 f% f
腾讯(QQ)求职俱乐部
! ?) k- p# l, Ihttp://bbs.aftjob.com/thread-37083-1-1.html1 I- ?" @/ i4 o2 J8 B5 K( x% u
——
9 ^; H; n( N+ K) b) B8 {' h  }. Q4 f$ Q6 c/ Z2 f6 H
# A  c* B* j0 `; f' O% e1 L
您需要登录后才可以回帖 登录 | 加入后院

本版积分规则

Archiver|手机版|小黑屋|广告业务Q|工大后院 ( 粤ICP备10013660号 )

GMT+8, 2026-4-21 00:33

Powered by Discuz! X5.0

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表