工大后院

 找回密码
 加入后院

扫一扫,访问微社区

QQ登录

只需一步,快速开始

搜索
查看: 1176|回复: 0

[兼职经验] 腾讯实习招聘面试题-软件开发

[复制链接]
发表于 2011-5-9 11:56 | 显示全部楼层 |阅读模式
腾讯实习招聘面试题-软件开发 6 H1 i* n* T- k& H

; d, r* [. Y% W( g( `# M: p9 g* G, D' {# ]: }9 x
腾讯实习招聘面试题-软件开发
4 J" o' T3 {. ^. k- n9 T
2 A5 Q: ]$ y0 U0 v6 R+ j! p. X3 t' n# Y5 G: G7 X9 P. C: F
zz- [) [2 D- g& z' u9 s' n
5 O; h- y9 m5 S( G4 C

. C7 r( t8 u4 j& c大部分是说说你自己的思想:
+ L* N- e2 S( W+ h/ O0 |5 _- V1,一亿个数中取中位数( e3 B  p- K  w$ D9 j; X6 p
2,一万个手机号有两个重复的,让你找出来
0 \/ ^7 Q  W  H7 U/ ^3,求二叉树中两节点的最长路径
8 c% K$ J3 p$ _% R, t5 B3 b( L. T2 x7 R- S% ~1 [7 X
1.有一亿个随机数,不排序如何找出其中位数. d& Q5 M/ p( L5 C9 Q
题目:在一个文件中有 10G 个整数,乱序排列,要求找出中位数。内存限制为 2G。只写出思路即可(内存限制为 2G的意思就是,可以使用2G的空间来运行程序,而不考虑这台机器上的其他软件的占用内存)。2 `/ i  m& j5 ~$ e: V0 u% H
' s( t& `* u0 ?. B
关于中位数:数据排序后,位置在最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。中位数的位置:当样本数为奇数时,中位数=(N+1)/2 ; 当样本数为偶数时,中位数为N/2与1+N/2的均值(那么10G个数的中位数,就第5G大的数与第5G+1大的数的均值了)。
8 |. a3 X* T: T# @* _8 @2 C! K" E, S- y7 h
分析:明显是一道工程性很强的题目,和一般的查找中位数的题目有几点不同。
  a! u6 j2 V/ f8 O$ u% U1. 原数据不能读进内存,不然可以用快速选择,如果数的范围合适的话还可以考虑桶排序或者计数排序,但这里假设是32位整数,仍有4G种取值,需要一个16G大小的数组来计数。
$ q0 x& \' c9 u; r9 X: F
3 @  c0 J; b+ J  A! k2 }2. 若看成从N个数中找出第K大的数,如果K个数可以读进内存,可以利用最小或最大堆,但这里K=N/2,有5G个数,仍然不能读进内存。
) Q3 _8 ]9 a; Z2 \+ n9 r0 s5 r6 S# j% O$ E4 Q' T) Y7 X
3. 接上,对于N个数和K个数都不能一次读进内存的情况,《编程之美》里给出一个方案:设k<K,且k个数可以完全读进内存,那么先构建k个数的堆,先找出第0到k大的数,再扫描一遍数组找出第k+1到2k的数,再扫描直到找出第K个数。虽然每次时间大约是nlog(k),但需要扫描ceil(K/k) 次,这里要扫描5次。& K' D. p/ u# F; {' v

# v+ `& H% q# h1 i解法:首先假设是32位无符号整数。
% A' }. g  W0 i) i7 E1. 读一遍10G个整数,把整数映射到256M个区段中,用一个64位无符号整数给每个相应区段记数。% W3 T' ]: t0 g: u9 J
说明:整数范围是0 - 2^32 - 1,一共有4G种取值,映射到256M个区段,则每个区段有16(4G/256M = 16)种值,每16个值算一段, 0~15是第1段,16~31是第2段,……2^32-16 ~2^32-1是第256M段。一个64位无符号整数最大值是0~8G-1,这里先不考虑溢出的情况。总共占用内存256M×8B=2GB。
& v6 w2 f6 [2 W" f
: C& B; r. M3 c2. 从前到后对每一段的计数累加,当累加的和超过5G时停止,找出这个区段(即累加停止时达到的区段,也是中位数所在的区段)的数值范围,设为[a,a+15],同时记录累加到前一个区段的总数,设为m。然后,释放除这个区段占用的内存。0 f$ [5 L- P' R" W/ L" J

" b4 a1 `$ ?- Z  k3. 再读一遍10G个整数,把在[a,a+15]内的每个值计数,即有16个计数。
* `& O* k' D4 ]+ q3 c% J% t0 l  f. G9 @
4. 对新的计数依次累加,每次的和设为n,当m+n的值超过5G时停止,此时的这个计数所对应的数就是中位数。
7 I- g" E$ k- P& k/ ~+ }# _0 Y+ N0 M0 Q1 @0 a! N; `- r
总结:
7 ]+ Q- `1 T" g* f1.以上方法只要读两遍整数,对每个整数也只是常数时间的操作,总体来说是线性时间。7 R+ u( U2 ^& [! k4 {0 c
' d9 E$ U( B" u( u+ B2 e. G" X
2. 考虑其他情况。7 j, g: l& j# f+ C6 D8 U0 W9 C
若是有符号的整数,只需改变映射即可。若是64为整数,则增加每个区段的范围,那么在第二次读数时,要考虑更多的计数。若过某个计数溢出,那么可认定所在的区段或代表整数为所求,这里只需做好相应的处理。噢,忘了还要找第5G+1大的数了,相信有了以上的成果,找到这个数也不难了吧。! N0 \, n* P0 ~

) _8 W# m2 o4 D7 w& t3. 时空权衡。
& E" H2 G. T1 b, V) x0 a花费256个区段也许只是恰好配合2GB的内存(其实也不是,呵呵)。可以增大区段范围,减少区段数目,节省一些内存,虽然增加第二部分的对单个数值的计数,但第一部分对每个区段的计数加快了(总体改变??待测)。
, ?7 m6 H' C+ a$ Q7 ?8 ?. A0 U3 t" h
; [. R7 H  A6 F3 D4. 映射时尽量用位操作,由于每个区段的起点都是2的整数幂,映射起来也很方便。
, o! m' R5 I5 F) p( Y& Q# W" K& _; V6 V6 N" c% u; i" `% z
2.假设有一个应用程序A,现要设计一个应用程序B来动态 测试A,问如何设计这个软件?
/ q2 t4 F3 F! q: n/ N) |! s) s+ ~  d! C
http://bbs.aftjob.com/thread-606762-1-1.html6 g8 Y( z: @& [/ @! B* o
7 U+ |9 b1 Q) k3 V7 `/ Y
——# b- C5 G* f5 z
腾讯(QQ)求职俱乐部, Y& ?% [1 Q4 ^! r. G! a
http://bbs.aftjob.com/thread-37083-1-1.html% O! L( K. j0 u
——8 B3 U/ v) F, `5 m+ n8 e6 @

- U3 N. o- T! X( H' B- b
9 \+ D1 |$ L, N* s
您需要登录后才可以回帖 登录 | 加入后院

本版积分规则

QQ|Archiver|手机版|小黑屋|广告业务Q|工大后院 ( 粤ICP备10013660号 )

GMT+8, 2024-6-4 14:25

Powered by Discuz! X3.5

Copyright © 2001-2024 Tencent Cloud.

快速回复 返回顶部 返回列表