找回密码
 加入后院

QQ登录

只需一步,快速开始

搜索
查看: 1338|回复: 0

[面筋] 腾讯实习招聘面试题-软件开发

[复制链接]
发表于 2012-4-20 17:13 | 显示全部楼层 |阅读模式
腾讯实习招聘面试题-软件开发 ; t3 [' I  w0 t( R0 f  k
9 m7 E' u( {3 O7 q+ m) ^

/ M9 N% I" @6 S5 K2 m2 d  c7 dzz2 O" T3 C2 w6 g% w
2 X" u( k$ Y2 s8 b; n6 \

  S2 i9 a' `7 D9 F4 T7 s" j大部分是说说你自己的思想:1 k6 I/ @1 p$ X: F9 n9 J( g
1,一亿个数中取中位数* S, a. J  ?+ q' \- E
2,一万个手机号有两个重复的,让你找出来( Y9 {/ O" u1 {$ q9 p; {
3,求二叉树中两节点的最长路径* e$ C2 L. v7 J! ?) e( q
. [! h1 q% o# T
1.有一亿个随机数,不排序如何找出其中位数9 u8 p* H# L; X+ b1 i) q3 e$ E
题目:在一个文件中有 10G 个整数,乱序排列,要求找出中位数。内存限制为 2G。只写出思路即可(内存限制为 2G的意思就是,可以使用2G的空间来运行程序,而不考虑这台机器上的其他软件的占用内存)。
$ U8 l, _) ]3 v( v" }# e! m# q9 ]/ C+ X% z
关于中位数:数据排序后,位置在最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。中位数的位置:当样本数为奇数时,中位数=(N+1)/2 ; 当样本数为偶数时,中位数为N/2与1+N/2的均值(那么10G个数的中位数,就第5G大的数与第5G+1大的数的均值了)。5 A& y% H  u' S$ E; S$ U

$ {" L3 q: n6 n% _  w: Z* I8 }分析:明显是一道工程性很强的题目,和一般的查找中位数的题目有几点不同。
% ]) J2 L/ T4 X5 p& G1. 原数据不能读进内存,不然可以用快速选择,如果数的范围合适的话还可以考虑桶排序或者计数排序,但这里假设是32位整数,仍有4G种取值,需要一个16G大小的数组来计数。4 N7 t2 j) K( _2 F0 K- L* d

+ q( P3 O' O& k1 k" T2. 若看成从N个数中找出第K大的数,如果K个数可以读进内存,可以利用最小或最大堆,但这里K=N/2,有5G个数,仍然不能读进内存。
2 C: j" G$ Q( ]+ @( r2 Z
- W1 @6 z1 Z5 F( ~3. 接上,对于N个数和K个数都不能一次读进内存的情况,《编程之美》里给出一个方案:设k<K,且k个数可以完全读进内存,那么先构建k个数的堆,先找出第0到k大的数,再扫描一遍数组找出第k+1到2k的数,再扫描直到找出第K个数。虽然每次时间大约是nlog(k),但需要扫描ceil(K/k) 次,这里要扫描5次。
6 n; L' _& J/ J
- S- {+ R# j  R  n# ]. i: M解法:首先假设是32位无符号整数。
7 o5 w" Y% c) j6 p% _) i  v1. 读一遍10G个整数,把整数映射到256M个区段中,用一个64位无符号整数给每个相应区段记数。' y  A1 L' F# T% X# f* P
说明:整数范围是0 - 2^32 - 1,一共有4G种取值,映射到256M个区段,则每个区段有16(4G/256M = 16)种值,每16个值算一段, 0~15是第1段,16~31是第2段,……2^32-16 ~2^32-1是第256M段。一个64位无符号整数最大值是0~8G-1,这里先不考虑溢出的情况。总共占用内存256M×8B=2GB。: \. i5 ~( z( y; E/ o6 \

( W- T( P1 `, K2 c2. 从前到后对每一段的计数累加,当累加的和超过5G时停止,找出这个区段(即累加停止时达到的区段,也是中位数所在的区段)的数值范围,设为[a,a+15],同时记录累加到前一个区段的总数,设为m。然后,释放除这个区段占用的内存。
* V0 s# f% \& B% j/ v) X! E- N- [! y" }# s. I
3. 再读一遍10G个整数,把在[a,a+15]内的每个值计数,即有16个计数。2 @4 v& X9 A. p, S7 K

, R) z# s+ w4 Z6 q! T4. 对新的计数依次累加,每次的和设为n,当m+n的值超过5G时停止,此时的这个计数所对应的数就是中位数。
" N/ r, b  |9 y
( u3 y1 A3 E, j! {0 e总结:9 y5 ?  E1 p* M$ J- i6 f
1.以上方法只要读两遍整数,对每个整数也只是常数时间的操作,总体来说是线性时间。  Q# r& u' h# n& V) G
) ?% Q( v2 {# \
2. 考虑其他情况。
( R, |: q4 m% y. t+ P若是有符号的整数,只需改变映射即可。若是64为整数,则增加每个区段的范围,那么在第二次读数时,要考虑更多的计数。若过某个计数溢出,那么可认定所在的区段或代表整数为所求,这里只需做好相应的处理。噢,忘了还要找第5G+1大的数了,相信有了以上的成果,找到这个数也不难了吧。, h* k; S- Q7 U) h( J; _

+ Q8 S" ]% A$ H8 f8 c/ D4 M3. 时空权衡。
, _1 A  X# S$ p  a花费256个区段也许只是恰好配合2GB的内存(其实也不是,呵呵)。可以增大区段范围,减少区段数目,节省一些内存,虽然增加第二部分的对单个数值的计数,但第一部分对每个区段的计数加快了(总体改变??待测)。4 n2 |9 l- p& w

+ A. s4 v" G# _+ b. T5 O' I) u4. 映射时尽量用位操作,由于每个区段的起点都是2的整数幂,映射起来也很方便。
0 b8 E' H+ k. u; K# s! @( z! Y: W7 A2 v! s3 @$ V) Z3 w% ^
2.假设有一个应用程序A,现要设计一个应用程序B来动态 测试A,问如何设计这个软件?
) _  ~* y" j/ q" A' n! H3 f# y  T" S$ z  J2 u& l
应聘腾讯面试问题靠记忆整理(四次面试):http://bbs.aftjob.com/thread-37097-1-1.html
* d% M2 e1 J" J4 ^$ i腾讯2010实习面试全纪录——终于结束了:http://bbs.aftjob.com/thread-612336-1-1.html  {, P% r% P* K

/ {5 A" E  }' b  d4 n腾讯求职交流俱乐部:http://bbs.aftjob.com/group-47-1.html
您需要登录后才可以回帖 登录 | 加入后院

本版积分规则

Archiver|手机版|小黑屋|广告业务Q|工大后院 ( 粤ICP备10013660号 )

GMT+8, 2026-4-2 01:47

Powered by Discuz! X5.0

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表