找回密码
 加入后院

扫一扫,访问微社区

QQ登录

只需一步,快速开始

搜索
查看: 1313|回复: 0

[面筋] 腾讯实习招聘面试题-软件开发

[复制链接]
发表于 2012-4-20 17:13 | 显示全部楼层 |阅读模式
腾讯实习招聘面试题-软件开发 7 k, q0 {6 d9 V0 d
% D( [( V3 k! d7 b. f

0 R1 K7 u) z* [+ Xzz# R  r$ T- \9 J0 Y: S/ {7 t; R% ~
& P, F8 A8 H1 H/ ~9 S7 k  H9 y

/ n  ?& @' ]( g# X) x大部分是说说你自己的思想:
  B) E5 O) q! N& ?1,一亿个数中取中位数
" p9 k* M. j7 H9 i- ]" Q$ v2,一万个手机号有两个重复的,让你找出来
& a9 \2 z' l1 h8 U" a2 E3,求二叉树中两节点的最长路径3 ?4 p4 C& L* K% W% ^
+ t# V" j; B1 a* _4 a' o- ^
1.有一亿个随机数,不排序如何找出其中位数7 R& K# U5 D7 k, Q
题目:在一个文件中有 10G 个整数,乱序排列,要求找出中位数。内存限制为 2G。只写出思路即可(内存限制为 2G的意思就是,可以使用2G的空间来运行程序,而不考虑这台机器上的其他软件的占用内存)。6 l4 F, M1 r6 N; y5 a

/ h! Z" i' b" l0 S. x3 c关于中位数:数据排序后,位置在最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。中位数的位置:当样本数为奇数时,中位数=(N+1)/2 ; 当样本数为偶数时,中位数为N/2与1+N/2的均值(那么10G个数的中位数,就第5G大的数与第5G+1大的数的均值了)。" I. V& i( F# ?6 o; y# H
3 N, L% i0 R% ?' B$ f
分析:明显是一道工程性很强的题目,和一般的查找中位数的题目有几点不同。
5 G9 T. y6 e5 D  E4 C) n  Y3 K1. 原数据不能读进内存,不然可以用快速选择,如果数的范围合适的话还可以考虑桶排序或者计数排序,但这里假设是32位整数,仍有4G种取值,需要一个16G大小的数组来计数。
2 {1 l6 i5 U' t* }  h, K& m/ E9 q) J1 G) X
2. 若看成从N个数中找出第K大的数,如果K个数可以读进内存,可以利用最小或最大堆,但这里K=N/2,有5G个数,仍然不能读进内存。; O" N' m/ n; X) |7 T
1 F0 Z) o: l5 v
3. 接上,对于N个数和K个数都不能一次读进内存的情况,《编程之美》里给出一个方案:设k<K,且k个数可以完全读进内存,那么先构建k个数的堆,先找出第0到k大的数,再扫描一遍数组找出第k+1到2k的数,再扫描直到找出第K个数。虽然每次时间大约是nlog(k),但需要扫描ceil(K/k) 次,这里要扫描5次。
/ \1 L2 l' _: S- [1 _9 Y+ E  M3 O3 P/ }! n- y& W7 C
解法:首先假设是32位无符号整数。
/ ]" v* M. ?) @* j6 K1. 读一遍10G个整数,把整数映射到256M个区段中,用一个64位无符号整数给每个相应区段记数。3 t6 c8 B2 j. t# V( i3 S
说明:整数范围是0 - 2^32 - 1,一共有4G种取值,映射到256M个区段,则每个区段有16(4G/256M = 16)种值,每16个值算一段, 0~15是第1段,16~31是第2段,……2^32-16 ~2^32-1是第256M段。一个64位无符号整数最大值是0~8G-1,这里先不考虑溢出的情况。总共占用内存256M×8B=2GB。
. |# u  `5 B* d/ w/ Z7 q( w
/ H! h9 g+ Y% {1 ^! y! p2. 从前到后对每一段的计数累加,当累加的和超过5G时停止,找出这个区段(即累加停止时达到的区段,也是中位数所在的区段)的数值范围,设为[a,a+15],同时记录累加到前一个区段的总数,设为m。然后,释放除这个区段占用的内存。
- r- @5 X% r+ J, B- p" m. F# J; M+ Y2 m& d; T% c) _2 G  G
3. 再读一遍10G个整数,把在[a,a+15]内的每个值计数,即有16个计数。
( q9 {: P, a6 ?$ {) M5 h5 K$ O; U3 r9 ^
4. 对新的计数依次累加,每次的和设为n,当m+n的值超过5G时停止,此时的这个计数所对应的数就是中位数。
! Q4 ]8 m! y' s4 Y: E$ V! U9 I# p! K- r/ y2 R$ ]% N
总结:
- o+ D2 u7 K8 O7 p1 ]1.以上方法只要读两遍整数,对每个整数也只是常数时间的操作,总体来说是线性时间。
0 \0 M( E3 v- {
: x2 p+ v7 J2 }: v+ j7 x1 R2. 考虑其他情况。
6 {- [, u( W2 |% d4 \9 {: z( _若是有符号的整数,只需改变映射即可。若是64为整数,则增加每个区段的范围,那么在第二次读数时,要考虑更多的计数。若过某个计数溢出,那么可认定所在的区段或代表整数为所求,这里只需做好相应的处理。噢,忘了还要找第5G+1大的数了,相信有了以上的成果,找到这个数也不难了吧。* [" Y8 \* p1 ?& C! f5 ?2 d

* u- Z" _* P+ Y5 Y& e* R! k8 v3. 时空权衡。
1 {0 j3 t( F5 _7 @/ I花费256个区段也许只是恰好配合2GB的内存(其实也不是,呵呵)。可以增大区段范围,减少区段数目,节省一些内存,虽然增加第二部分的对单个数值的计数,但第一部分对每个区段的计数加快了(总体改变??待测)。( N# ^2 }# l' G+ _) r* }1 \1 \
! f8 u4 o; s: r& T9 D0 o4 c
4. 映射时尽量用位操作,由于每个区段的起点都是2的整数幂,映射起来也很方便。
4 A- Z! S6 @4 v. z$ d& q- L
" L: W- k! r) g* E; i; k& Z1 _2.假设有一个应用程序A,现要设计一个应用程序B来动态 测试A,问如何设计这个软件?" ^2 O+ D4 Q; I  K
+ S; a. Y2 F# ~) A5 W3 l% K
应聘腾讯面试问题靠记忆整理(四次面试):http://bbs.aftjob.com/thread-37097-1-1.html
' J. Q, k1 Y5 K/ F% p: k- d腾讯2010实习面试全纪录——终于结束了:http://bbs.aftjob.com/thread-612336-1-1.html4 H$ H( f2 _6 i* t, d: j$ ~+ k) b
6 `% E+ G3 S! \9 e
腾讯求职交流俱乐部:http://bbs.aftjob.com/group-47-1.html
您需要登录后才可以回帖 登录 | 加入后院

本版积分规则

QQ|Archiver|手机版|小黑屋|广告业务Q|工大后院 ( 粤ICP备10013660号 )

GMT+8, 2025-12-14 16:36

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表