|
|
|
腾讯实习招聘面试题-软件开发 ; L9 ]8 ~+ Z" u8 F8 S2 Q
/ X! H {/ o4 u2 O+ a! q, U. r* h4 R
腾讯实习招聘面试题-软件开发
, s3 x% W1 r1 l- O! X. { i$ q
4 c% I) n! q) F1 w2 `' u8 c M6 L; i; H4 r1 M1 t& _. k
zz: ? [1 z3 R3 w# H- N: p: ^* K
# h7 S7 B5 ?- s& S! u& H6 ?, A6 O7 y
大部分是说说你自己的思想:
3 b2 m N# m2 z( d A( M1,一亿个数中取中位数
& u( y) M5 g* g2,一万个手机号有两个重复的,让你找出来8 p* } m0 V* k* ]- @* _0 j p; O
3,求二叉树中两节点的最长路径
4 t+ f. W f; ^5 _0 d
. f5 P- S' \) q/ U V; x% H7 v0 l1.有一亿个随机数,不排序如何找出其中位数
3 {& J' m q K3 v: e题目:在一个文件中有 10G 个整数,乱序排列,要求找出中位数。内存限制为 2G。只写出思路即可(内存限制为 2G的意思就是,可以使用2G的空间来运行程序,而不考虑这台机器上的其他软件的占用内存)。- L* ^" n; N7 C- T
/ w/ h' O, b! x' \5 k关于中位数:数据排序后,位置在最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。中位数的位置:当样本数为奇数时,中位数=(N+1)/2 ; 当样本数为偶数时,中位数为N/2与1+N/2的均值(那么10G个数的中位数,就第5G大的数与第5G+1大的数的均值了)。& I, h" ]* x* c$ `: _1 W0 h* ^6 x
0 A3 E4 o7 _" ?! j* K6 M/ x分析:明显是一道工程性很强的题目,和一般的查找中位数的题目有几点不同。
3 }# F4 l- |. A( e& ~6 B1. 原数据不能读进内存,不然可以用快速选择,如果数的范围合适的话还可以考虑桶排序或者计数排序,但这里假设是32位整数,仍有4G种取值,需要一个16G大小的数组来计数。; q, `" ]( e) ]! Z
/ L8 p& C, G1 s2. 若看成从N个数中找出第K大的数,如果K个数可以读进内存,可以利用最小或最大堆,但这里K=N/2,有5G个数,仍然不能读进内存。
5 }+ ~9 @7 _* E# F: D0 i# g) s! h. q8 n: a
3. 接上,对于N个数和K个数都不能一次读进内存的情况,《编程之美》里给出一个方案:设k<K,且k个数可以完全读进内存,那么先构建k个数的堆,先找出第0到k大的数,再扫描一遍数组找出第k+1到2k的数,再扫描直到找出第K个数。虽然每次时间大约是nlog(k),但需要扫描ceil(K/k) 次,这里要扫描5次。- U( T- ?- I) A& R& _! F5 k
7 X* ]% ^, E) r* L' y* u
解法:首先假设是32位无符号整数。
& _( \- E# ?4 O8 H1. 读一遍10G个整数,把整数映射到256M个区段中,用一个64位无符号整数给每个相应区段记数。
* E- ]; m8 Q- F说明:整数范围是0 - 2^32 - 1,一共有4G种取值,映射到256M个区段,则每个区段有16(4G/256M = 16)种值,每16个值算一段, 0~15是第1段,16~31是第2段,……2^32-16 ~2^32-1是第256M段。一个64位无符号整数最大值是0~8G-1,这里先不考虑溢出的情况。总共占用内存256M×8B=2GB。" H$ E; U3 r+ K* n0 Q, G+ Q
6 ]$ [: e' ^) ^3 b$ F6 C- x t' q& q
2. 从前到后对每一段的计数累加,当累加的和超过5G时停止,找出这个区段(即累加停止时达到的区段,也是中位数所在的区段)的数值范围,设为[a,a+15],同时记录累加到前一个区段的总数,设为m。然后,释放除这个区段占用的内存。
- g+ c; W! x6 a8 T$ o; ?# x
- y0 T+ Y0 w" i& i% J1 a* h3. 再读一遍10G个整数,把在[a,a+15]内的每个值计数,即有16个计数。+ p0 i/ S' a" R$ J
( ^* q3 _4 n ~" D4. 对新的计数依次累加,每次的和设为n,当m+n的值超过5G时停止,此时的这个计数所对应的数就是中位数。0 w5 P. N: |7 }$ W
, Q& |2 D4 N& k z总结:7 U. e/ U8 x1 p ^8 c5 t
1.以上方法只要读两遍整数,对每个整数也只是常数时间的操作,总体来说是线性时间。
) K9 W! s% w# j9 j, _; v4 K6 A
4 k G" L" t- d) f/ \0 R4 ^2. 考虑其他情况。
1 J7 U# k0 A- F* `- k z若是有符号的整数,只需改变映射即可。若是64为整数,则增加每个区段的范围,那么在第二次读数时,要考虑更多的计数。若过某个计数溢出,那么可认定所在的区段或代表整数为所求,这里只需做好相应的处理。噢,忘了还要找第5G+1大的数了,相信有了以上的成果,找到这个数也不难了吧。
' X8 S* b' F3 K# Z
* M9 a! r S3 n4 E$ G3. 时空权衡。5 K! G$ @ |+ M& q# Q$ N9 _0 s! H
花费256个区段也许只是恰好配合2GB的内存(其实也不是,呵呵)。可以增大区段范围,减少区段数目,节省一些内存,虽然增加第二部分的对单个数值的计数,但第一部分对每个区段的计数加快了(总体改变??待测)。, c1 p' S# ~* \# @ l" b6 Z
" @/ x# \3 F' y9 F4. 映射时尽量用位操作,由于每个区段的起点都是2的整数幂,映射起来也很方便。
+ `1 p: b7 d* d1 ~2 W8 h% N5 y* C. G D9 k, W+ s
2.假设有一个应用程序A,现要设计一个应用程序B来动态 测试A,问如何设计这个软件?
" N; K! W! A d) z
" V) y. L( G1 o f* M8 ehttp://bbs.aftjob.com/thread-606762-1-1.html0 m* J! x! E3 J( B' v. Z
" J+ f: m8 `3 e5 I6 N——* P6 [2 l: c( Y, u8 U. G, M! }
腾讯(QQ)求职俱乐部3 L( H' U+ a. C1 C, z3 N
http://bbs.aftjob.com/thread-37083-1-1.html
) G" `5 x" A: F4 Q' w——9 Z( S! @6 n" F; Y8 E5 ]( t$ b7 q
- C) z+ j. n9 P V/ f [( J$ X! _# E/ F; l+ {6 X" V% v* N) U
|
|