找回密码
 加入后院

QQ登录

只需一步,快速开始

搜索
查看: 1329|回复: 0

[兼职经验] 腾讯实习招聘面试题-软件开发

[复制链接]
发表于 2011-5-9 11:56 | 显示全部楼层 |阅读模式
腾讯实习招聘面试题-软件开发 6 g7 p% @4 p, U# n+ e

5 ^" b. A7 E5 H6 P
9 p# @2 q; J0 F0 t" H$ J' H) r腾讯实习招聘面试题-软件开发
8 l: W5 ]8 n) x% M; s" @  M
% G( L& f. V0 _. b: F7 ?9 M1 i: I
9 a& k# L6 z& ozz
5 F. j; {) Q  q8 w& \( p" v& c! r6 Q& ?
* [# f0 V' I/ A) Z
大部分是说说你自己的思想:) S# T) r4 w& l4 r# V0 a! x
1,一亿个数中取中位数/ x' D- A5 u5 a8 _
2,一万个手机号有两个重复的,让你找出来% G& N+ D$ n  x& ]8 r
3,求二叉树中两节点的最长路径
1 G" K2 X5 L/ _# ]( I+ a( E
( k1 n1 k) p2 V+ z1.有一亿个随机数,不排序如何找出其中位数; b, ^9 N% n& H1 Q
题目:在一个文件中有 10G 个整数,乱序排列,要求找出中位数。内存限制为 2G。只写出思路即可(内存限制为 2G的意思就是,可以使用2G的空间来运行程序,而不考虑这台机器上的其他软件的占用内存)。
, g# `3 k. i9 w( D4 ]8 Z. S
. T; ^1 \" y. ?) I1 q& E8 Y* Y" V关于中位数:数据排序后,位置在最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。中位数的位置:当样本数为奇数时,中位数=(N+1)/2 ; 当样本数为偶数时,中位数为N/2与1+N/2的均值(那么10G个数的中位数,就第5G大的数与第5G+1大的数的均值了)。7 Q9 |* o6 r4 u  _7 k% h) q

3 x# M8 Q/ K5 x# s( \6 P6 B分析:明显是一道工程性很强的题目,和一般的查找中位数的题目有几点不同。
4 z- ^" d  ]5 r3 l1. 原数据不能读进内存,不然可以用快速选择,如果数的范围合适的话还可以考虑桶排序或者计数排序,但这里假设是32位整数,仍有4G种取值,需要一个16G大小的数组来计数。" S2 |4 ~( U, R) A

7 g- C" J4 S* {# _+ t2. 若看成从N个数中找出第K大的数,如果K个数可以读进内存,可以利用最小或最大堆,但这里K=N/2,有5G个数,仍然不能读进内存。& r, [* \' m0 S- `% J

9 {. E) K: G) S: R  {+ Z0 Z4 x4 M3. 接上,对于N个数和K个数都不能一次读进内存的情况,《编程之美》里给出一个方案:设k<K,且k个数可以完全读进内存,那么先构建k个数的堆,先找出第0到k大的数,再扫描一遍数组找出第k+1到2k的数,再扫描直到找出第K个数。虽然每次时间大约是nlog(k),但需要扫描ceil(K/k) 次,这里要扫描5次。2 K3 z8 B+ |! ~) [$ }

6 F. M' S: {: q; i$ i- t解法:首先假设是32位无符号整数。, r( W9 }4 @" K- @% Y- T
1. 读一遍10G个整数,把整数映射到256M个区段中,用一个64位无符号整数给每个相应区段记数。5 w# p) m$ {/ ]8 T9 }$ b
说明:整数范围是0 - 2^32 - 1,一共有4G种取值,映射到256M个区段,则每个区段有16(4G/256M = 16)种值,每16个值算一段, 0~15是第1段,16~31是第2段,……2^32-16 ~2^32-1是第256M段。一个64位无符号整数最大值是0~8G-1,这里先不考虑溢出的情况。总共占用内存256M×8B=2GB。
! Z& q5 a, A1 [+ d" O2 `! V- O4 j1 R% c8 t: n$ A9 W- \
2. 从前到后对每一段的计数累加,当累加的和超过5G时停止,找出这个区段(即累加停止时达到的区段,也是中位数所在的区段)的数值范围,设为[a,a+15],同时记录累加到前一个区段的总数,设为m。然后,释放除这个区段占用的内存。
2 U6 U- w- a, W/ H7 o/ C+ j
8 ]3 N) x5 u) Q0 Q+ O6 c+ D3. 再读一遍10G个整数,把在[a,a+15]内的每个值计数,即有16个计数。4 j, d! l" v2 t3 C$ U- z" i: A" I9 _
5 }% t# X. x* p) G
4. 对新的计数依次累加,每次的和设为n,当m+n的值超过5G时停止,此时的这个计数所对应的数就是中位数。8 C- c, m; d# P0 a* d0 j- [2 O
2 x$ r# J$ V( u* U- D* W) g, z
总结:
5 J9 p/ c5 [4 n2 E) m+ }1.以上方法只要读两遍整数,对每个整数也只是常数时间的操作,总体来说是线性时间。
" L! z$ y  Z6 _# L7 g
" H1 E. W: l; W6 W7 E5 y$ Z" |& A2. 考虑其他情况。
9 |% [, X* a5 }- N! G; @8 w3 F2 e若是有符号的整数,只需改变映射即可。若是64为整数,则增加每个区段的范围,那么在第二次读数时,要考虑更多的计数。若过某个计数溢出,那么可认定所在的区段或代表整数为所求,这里只需做好相应的处理。噢,忘了还要找第5G+1大的数了,相信有了以上的成果,找到这个数也不难了吧。, N$ n. @/ G2 g; o
; C  h, {& B! k# h
3. 时空权衡。
( \$ X9 r$ W# L: t  X) F6 Z' B花费256个区段也许只是恰好配合2GB的内存(其实也不是,呵呵)。可以增大区段范围,减少区段数目,节省一些内存,虽然增加第二部分的对单个数值的计数,但第一部分对每个区段的计数加快了(总体改变??待测)。
9 }) M; b! R" N3 J: z, |: q5 {2 J
9 b  [9 s5 m) K0 s5 T! O8 a7 U4. 映射时尽量用位操作,由于每个区段的起点都是2的整数幂,映射起来也很方便。 2 y# P1 w" A! \0 j* Q/ W# S

7 O' e) r- j2 A7 o. `% C2.假设有一个应用程序A,现要设计一个应用程序B来动态 测试A,问如何设计这个软件?
$ \& P% n6 @3 V- z# n& p) e4 g5 K, c% @, u- J* A7 k
http://bbs.aftjob.com/thread-606762-1-1.html4 }  E2 E2 W/ J, }9 i. X  N
+ `4 v9 F/ E& y& _5 d9 O" N
——
2 @6 M" I- u/ q5 c! j腾讯(QQ)求职俱乐部5 Z% g& x7 |8 @6 ?- ~+ |# k
http://bbs.aftjob.com/thread-37083-1-1.html7 c' U/ L8 ?) |% r
——  h; Q& O2 k" a

# ^0 N4 [9 U8 x" O- W- q5 _. P& g9 X
您需要登录后才可以回帖 登录 | 加入后院

本版积分规则

Archiver|手机版|小黑屋|广告业务Q|工大后院 ( 粤ICP备10013660号 )

GMT+8, 2026-4-21 00:39

Powered by Discuz! X5.0

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表