找回密码
 加入后院

扫一扫,访问微社区

QQ登录

只需一步,快速开始

搜索
查看: 1298|回复: 0

[兼职经验] 腾讯实习招聘面试题-软件开发

[复制链接]
发表于 2011-5-9 11:56 | 显示全部楼层 |阅读模式
腾讯实习招聘面试题-软件开发 ) q! _3 l. u! c7 s; Y/ Z" S
+ S. A6 Y9 U( y3 L4 P0 g

0 y0 E7 m) Y7 ?; _* [2 c1 N: v腾讯实习招聘面试题-软件开发
; L, Y& o8 y; M
2 b: V% u3 a2 a1 N- b; {$ A5 x7 i
zz
% A; X& w: s: g9 N0 H( H' N, p& e$ y" N; @& j
4 N- `, ~; s/ S1 _+ l! h5 e
大部分是说说你自己的思想:1 V9 x) X4 O. g' Q
1,一亿个数中取中位数* H. C6 g, H7 c
2,一万个手机号有两个重复的,让你找出来
1 o% k! w9 L, M$ B6 E( V3,求二叉树中两节点的最长路径
6 K, ^1 {, x- H/ o; J) }. i4 M7 v! P' B; y7 j
1.有一亿个随机数,不排序如何找出其中位数
( G/ K9 A( p9 k: S6 `4 j题目:在一个文件中有 10G 个整数,乱序排列,要求找出中位数。内存限制为 2G。只写出思路即可(内存限制为 2G的意思就是,可以使用2G的空间来运行程序,而不考虑这台机器上的其他软件的占用内存)。8 h2 a/ I6 o0 D- P( Y
- F# \* u* O! {
关于中位数:数据排序后,位置在最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。中位数的位置:当样本数为奇数时,中位数=(N+1)/2 ; 当样本数为偶数时,中位数为N/2与1+N/2的均值(那么10G个数的中位数,就第5G大的数与第5G+1大的数的均值了)。! _- {4 R8 l( D

- `( z2 j( q. `, C, E分析:明显是一道工程性很强的题目,和一般的查找中位数的题目有几点不同。
1 z5 v; G! x& N% N' f! Y# D) n1. 原数据不能读进内存,不然可以用快速选择,如果数的范围合适的话还可以考虑桶排序或者计数排序,但这里假设是32位整数,仍有4G种取值,需要一个16G大小的数组来计数。
: v- T+ a7 F3 n) P- \
. B& W' a: L1 B: e2. 若看成从N个数中找出第K大的数,如果K个数可以读进内存,可以利用最小或最大堆,但这里K=N/2,有5G个数,仍然不能读进内存。
" X( B! C: f' I9 c+ t5 ^. l' w& h$ G) |) D
3. 接上,对于N个数和K个数都不能一次读进内存的情况,《编程之美》里给出一个方案:设k<K,且k个数可以完全读进内存,那么先构建k个数的堆,先找出第0到k大的数,再扫描一遍数组找出第k+1到2k的数,再扫描直到找出第K个数。虽然每次时间大约是nlog(k),但需要扫描ceil(K/k) 次,这里要扫描5次。1 o) q0 X+ V! ?" t$ G: T& R: c

4 f/ G6 A  m+ N* L2 _解法:首先假设是32位无符号整数。
& l+ I4 A4 h, ?" x0 u9 ~1. 读一遍10G个整数,把整数映射到256M个区段中,用一个64位无符号整数给每个相应区段记数。* G1 q! r$ T8 I# a
说明:整数范围是0 - 2^32 - 1,一共有4G种取值,映射到256M个区段,则每个区段有16(4G/256M = 16)种值,每16个值算一段, 0~15是第1段,16~31是第2段,……2^32-16 ~2^32-1是第256M段。一个64位无符号整数最大值是0~8G-1,这里先不考虑溢出的情况。总共占用内存256M×8B=2GB。
. P; X7 x( Y# ]  S- i3 k" @. }; u! p' r: ?1 Q0 b
2. 从前到后对每一段的计数累加,当累加的和超过5G时停止,找出这个区段(即累加停止时达到的区段,也是中位数所在的区段)的数值范围,设为[a,a+15],同时记录累加到前一个区段的总数,设为m。然后,释放除这个区段占用的内存。7 G4 `, d4 L& C3 v
$ v7 _( h" H9 t$ h* Z! q1 k
3. 再读一遍10G个整数,把在[a,a+15]内的每个值计数,即有16个计数。
7 C; K0 W" y) B" |  s; C- {
5 |* h, ?+ ^6 `# v. ^4. 对新的计数依次累加,每次的和设为n,当m+n的值超过5G时停止,此时的这个计数所对应的数就是中位数。
3 H4 z4 P) H3 g4 O" L5 c- A# y' L6 U' B# E" G6 ]; E) t4 k
总结:
# F. M. S% H: |1.以上方法只要读两遍整数,对每个整数也只是常数时间的操作,总体来说是线性时间。
# o& j- ]! ], z
5 Z/ N$ E/ h1 J3 Q1 z+ H2. 考虑其他情况。
  ^# u4 o$ A& Z" f若是有符号的整数,只需改变映射即可。若是64为整数,则增加每个区段的范围,那么在第二次读数时,要考虑更多的计数。若过某个计数溢出,那么可认定所在的区段或代表整数为所求,这里只需做好相应的处理。噢,忘了还要找第5G+1大的数了,相信有了以上的成果,找到这个数也不难了吧。9 W! {  [7 L* S* \+ |: r' C
. y, a) I" t; I
3. 时空权衡。
/ H& R" ~% y& H* F1 ^7 [花费256个区段也许只是恰好配合2GB的内存(其实也不是,呵呵)。可以增大区段范围,减少区段数目,节省一些内存,虽然增加第二部分的对单个数值的计数,但第一部分对每个区段的计数加快了(总体改变??待测)。0 V" r% N9 J3 `3 h6 Z

% g$ V1 N8 l) s) J4. 映射时尽量用位操作,由于每个区段的起点都是2的整数幂,映射起来也很方便。
, M5 d" r& _! f9 h7 D/ J: d: g# Q+ a/ Q& N, G
2.假设有一个应用程序A,现要设计一个应用程序B来动态 测试A,问如何设计这个软件?
# @% y  k7 u" e9 S; j+ `/ m- o$ s- |8 {3 o" d
http://bbs.aftjob.com/thread-606762-1-1.html
6 u" J3 b. l" B; r& V2 L+ o( d4 `! X. j9 p% w- ?* r
——$ {0 i6 `' U* \7 i) [
腾讯(QQ)求职俱乐部, ^; V; f' g( V+ W; A6 x' D
http://bbs.aftjob.com/thread-37083-1-1.html* P3 [% K/ y0 i. S/ P" `2 I
——
1 d/ z  K9 l0 ^5 t' `0 C8 ^6 _, Q
3 `4 \# E4 }2 K0 f6 o. Q: S2 a0 J/ M( Z4 [1 f: ~: F
您需要登录后才可以回帖 登录 | 加入后院

本版积分规则

QQ|Archiver|手机版|小黑屋|广告业务Q|工大后院 ( 粤ICP备10013660号 )

GMT+8, 2025-12-1 20:01

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表