|
|
|
腾讯实习招聘面试题-软件开发
$ j% r( B! }% t& I4 T" C# _* l8 M; w# u6 O. e! C. e/ B! d/ t" G
2 y( A, Z1 Z2 z: ^腾讯实习招聘面试题-软件开发 2 A. D, s/ o7 D o' E0 Y9 [- O p
1 q9 H! e$ T+ C/ f; v
1 t+ @9 F0 I) S& Uzz7 b5 b H% R$ E2 X. e
! M( K: ?' _- M/ }5 W) G! { l3 A: f$ W/ \* g9 F3 w3 w' f
大部分是说说你自己的思想:
( K \4 C, W6 N- k* K1,一亿个数中取中位数9 K: U2 u5 n0 e( \1 q
2,一万个手机号有两个重复的,让你找出来3 H9 @6 ~2 j% z- Q# A
3,求二叉树中两节点的最长路径8 O) Q& B% @$ i# D
2 J8 P' {- J' ?% f0 F) L1.有一亿个随机数,不排序如何找出其中位数
. H" J' _! s3 u题目:在一个文件中有 10G 个整数,乱序排列,要求找出中位数。内存限制为 2G。只写出思路即可(内存限制为 2G的意思就是,可以使用2G的空间来运行程序,而不考虑这台机器上的其他软件的占用内存)。1 Y* i- s% Y6 v Z( J
% T/ @0 q, K) N# E% X关于中位数:数据排序后,位置在最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。中位数的位置:当样本数为奇数时,中位数=(N+1)/2 ; 当样本数为偶数时,中位数为N/2与1+N/2的均值(那么10G个数的中位数,就第5G大的数与第5G+1大的数的均值了)。$ s* F' W" @+ G. @" j# e. {# H
# T0 v/ i5 r! J; U$ }
分析:明显是一道工程性很强的题目,和一般的查找中位数的题目有几点不同。; G5 P4 R' _4 g8 P! ?+ P' D4 f
1. 原数据不能读进内存,不然可以用快速选择,如果数的范围合适的话还可以考虑桶排序或者计数排序,但这里假设是32位整数,仍有4G种取值,需要一个16G大小的数组来计数。
) {& e# U' w/ m/ W
* D+ L; O8 n/ \5 q1 _; F5 E; _2. 若看成从N个数中找出第K大的数,如果K个数可以读进内存,可以利用最小或最大堆,但这里K=N/2,有5G个数,仍然不能读进内存。
, y4 u& L& B3 K* h! E+ n2 _
/ e/ j, W0 y9 ^# R# S+ ~9 s* K8 q9 `3. 接上,对于N个数和K个数都不能一次读进内存的情况,《编程之美》里给出一个方案:设k<K,且k个数可以完全读进内存,那么先构建k个数的堆,先找出第0到k大的数,再扫描一遍数组找出第k+1到2k的数,再扫描直到找出第K个数。虽然每次时间大约是nlog(k),但需要扫描ceil(K/k) 次,这里要扫描5次。: ^6 J4 h9 A" x
" C/ q) b5 i" y- f& u& D. V0 i解法:首先假设是32位无符号整数。" O9 T) t# s# l& F% ^+ H
1. 读一遍10G个整数,把整数映射到256M个区段中,用一个64位无符号整数给每个相应区段记数。2 `% `9 l; q, J! f. d# ]
说明:整数范围是0 - 2^32 - 1,一共有4G种取值,映射到256M个区段,则每个区段有16(4G/256M = 16)种值,每16个值算一段, 0~15是第1段,16~31是第2段,……2^32-16 ~2^32-1是第256M段。一个64位无符号整数最大值是0~8G-1,这里先不考虑溢出的情况。总共占用内存256M×8B=2GB。4 ^/ f: F+ n# H; j) h/ c
) y# c8 c/ F0 }' q/ Q9 }
2. 从前到后对每一段的计数累加,当累加的和超过5G时停止,找出这个区段(即累加停止时达到的区段,也是中位数所在的区段)的数值范围,设为[a,a+15],同时记录累加到前一个区段的总数,设为m。然后,释放除这个区段占用的内存。
% d2 X, B# y1 ? O; |7 U/ n
" _/ ?( R3 o! X1 c- {3. 再读一遍10G个整数,把在[a,a+15]内的每个值计数,即有16个计数。" m) O% M# t& B* x: X( F8 g
7 d9 p2 z: c$ z4 J$ r
4. 对新的计数依次累加,每次的和设为n,当m+n的值超过5G时停止,此时的这个计数所对应的数就是中位数。
6 t% f1 X+ u3 l3 A; `
4 s. a+ C8 f5 G7 I, x; r s总结:
; d; A6 o$ G0 Q( d' u1.以上方法只要读两遍整数,对每个整数也只是常数时间的操作,总体来说是线性时间。; G* |3 u4 G6 @3 H. J' Z5 ?1 y
6 k8 }/ s* _' H; ^' O# D7 p1 p, |
2. 考虑其他情况。
8 y1 A. Q; Y& X若是有符号的整数,只需改变映射即可。若是64为整数,则增加每个区段的范围,那么在第二次读数时,要考虑更多的计数。若过某个计数溢出,那么可认定所在的区段或代表整数为所求,这里只需做好相应的处理。噢,忘了还要找第5G+1大的数了,相信有了以上的成果,找到这个数也不难了吧。
5 E0 H3 Q7 T# A- u' x4 W- ^
; I' t0 v9 }$ ]3. 时空权衡。$ P' U: h& f2 Q. [
花费256个区段也许只是恰好配合2GB的内存(其实也不是,呵呵)。可以增大区段范围,减少区段数目,节省一些内存,虽然增加第二部分的对单个数值的计数,但第一部分对每个区段的计数加快了(总体改变??待测)。. n3 ?6 t, Q3 s& T, l2 e7 l6 |3 _
0 I7 C5 P9 A9 O4. 映射时尽量用位操作,由于每个区段的起点都是2的整数幂,映射起来也很方便。
: y6 q# C7 v0 }4 k! r1 D$ U
0 b9 l l2 a" i2 U2.假设有一个应用程序A,现要设计一个应用程序B来动态 测试A,问如何设计这个软件?$ g, @) v% F- ?3 k; o
- F& s; J. T# v# p# yhttp://bbs.aftjob.com/thread-606762-1-1.html
8 K' Z4 }! A2 |8 G$ d9 x5 W u/ m9 m
——
( l8 ~2 u e9 A. t7 C3 P9 ~" N腾讯(QQ)求职俱乐部' n8 l' f5 G1 M+ `9 {/ d
http://bbs.aftjob.com/thread-37083-1-1.html
4 x2 {4 D7 a3 p/ V5 z: H3 A0 M——& j4 ~7 Z' Q- ]9 U& B* l9 K
# e: _+ s- I N; W3 n7 Z9 y0 u
5 N8 j, j l2 S* p6 L) |6 x+ k |
|