找回密码
 加入后院

QQ登录

只需一步,快速开始

搜索
查看: 1190|回复: 0

[面筋] 08.13 – 百度日文图搜1,2面 - 余总

[复制链接]
发表于 2011-5-23 10:48 | 显示全部楼层 |阅读模式
08.13 – 百度日文图搜1,2面 - 余总/ L# v4 P! z( }6 n! g+ Y

" d3 R. F6 _% q4 Q4 M! f2 F1 A5 L( x/ C- V, O

4 M4 b% U, b4 P' N# z, @) S在朋友的帮助下,今天面百度 一共面了两面,第一个人面完,喊出另外一个工程师接着面。( x+ D) ^& V) A5 h, j1 o
面试三点开始。我去得比较早,就在大厅里面等了个把钟头,环境看上去不错。哈哈。具体后面说。$ Q7 f9 L* f2 W/ D
+ I% j4 D' Y( g/ ]
第一面+ t' o( y; L4 \5 X
一个哥哥,挺kind的。聊天知道貌似是浙大ACM的,而且还跟我们大组的一个博士gg是好朋友。
0 ~6 x2 i9 {# W# N, j首先,自我介绍,稍微说了下。这里我觉得是每个人唯一可以准备得最好的了。说条理点,给人家一个立体印象会很好。然后就要“例行公事了”,开搞:% ^) b7 n/ m' o- D
第一题,据说中的经典算法,数组a[len],找出其中最大的三个数。写程序,写个意思就行。
0 y8 u0 y5 b# ?第二题 ,貌似搞算法的人都知道,应该也是据说中的经典题。有一个单向链表。对于单链表,链表尾部是NULL。突然有一天,某人没事把尾部的指针指向了链表中间的某个元素,这样就形成了一个网球拍状的链表,一个柄,然后前面一个圈。  / z% i% T7 a/ t+ _
  问题1:如何遍历链表(可以重复访问)(hint:简单next访问的话,会死循环在圈里的哦,所以得想点办法)3 B& Z( O2 |7 V& D1 J4 A5 x* S0 P
  问题2:如何确定柄和圈相接位置的元素是哪个?
1 X4 `2 c3 n- P* _6 ?0 u2 A2 ~$ @第三题,开放题,关于图片搜索。
5 P& I2 {7 ?" ]+ P1 \0 q6 E3 N一个页面,例如http://esfang.house.sina.com.cn/n_news/news_show.php?id=20439这个link里面,有个图片。图片搜索的基本思想是候根据页面正文的内容来推测图片内容。这个页面中,除了正文上有文字,顶上、边上都有链接和广告,是与图片不相关的内容,需要过滤掉。如何过滤这些五官内容,提取正文? 请说出你的思路。方法可以不拘一格,可以多种方法并用。我扯出了六七种,应该都还蛮靠谱。
) h1 e9 ~3 i6 s# l' T
. p- @' l1 Z' j# F- TOK,就这么多面试问题。我看了下表,刚好一个小时。这个gg喊了另外一个gg来接着面。
0 \% j! x( |0 {. r2 u+ |% d8 D9 i
% F. d2 V* j9 K- _5 s- z- J二面开始
9 q# e: z/ r  J还是先自我介绍,让随便讲讲。很快进入主题,开始做题:
' {$ t) {9 v  @' c/ C; `第一题 : 100万行ip地址区间,已排序。给出一个ip地址,从100万行中找出该ip地址所属行。如果找不到,输出找不到即可。; `3 }7 D$ ]$ J3 Y. d
已知,区间首尾两个ip的前三节的ip地址相等,只有最后一节不同。
& r6 r+ h" x8 i例如:. y$ H0 \& r9 L0 Q3 K
127.0.0.3   ~  127.0.0.6# D! b/ n2 ^% }' F
127.0.0.16 ~  127.0.0.49        ( z) `, M+ z# o7 Q$ D5 D/ s8 o/ Z
.....' C  D! t  O& V8 K# M/ e
210.2.0.16 ~  210.2.0.233$ V+ T; f" o7 @& W
.....& p* i) I- A$ m6 P& |4 g
上面每个区间前三节都等。1 G- c# M* s4 @5 Y
210.2.0.16 ~  210.4.0.233这样的区间不合法,不回出现在给出的
" ^' I" ?' H4 m0 E' F6 U数据中。3 \; _6 @& ?+ H" G( A) w: G" k
给出输入127.0.0.18,输出为127.0.0.16 ~  127.0.0.49。
) d5 q! n% c4 k- ?; d- E0 A
9 z( G3 i6 k8 Y- {& h这个题目补充一句,最容易想到的算法就是二分查找了。可行。面试的人非得让我想出个更快的方法。没想出来,到最后结束的时候问了下他答案,也就是加快查找那些事,恩,你知道的。
( ]/ q# O. M7 U' `6 \7 M# h  m7 \$ h
第二题 ,你知道Cache替换算法有哪些嘛?你学过吗?5 y6 c) W9 O1 b5 ?1 }/ R
恩,我当然学过。blablabla& [% R8 [# l' W- E8 E; E
那么你能实现一个LRU Cache算法吗?" |( M9 _- D" O  R9 p0 N( K; t& h5 p" Y
我走偏了。。。。。直接以为要实现一个硬件Cache LRU替换算法。。。太失误了。。。他一个搞软件的,关心硬件Cache干吗。。。
5 U' n$ c/ b7 o1 |. Q3 I7 LOK,软件LRU算法如何实现大家肯定都知道。
" u* U# x* \: a7 d3 P' O! b* {% h这个题目是他一个引子,后面开始才是重点。题目大意,百度贴吧这么多帖子,动不动还有“贾君鹏你妈喊你回家吃饭”的爆吧行为。如何设计一套存储系统以满足贴吧的需求。设计包括Cache、磁盘文件数据块的布局、结构、安排等等。总之,设计一个存储系统!我真有点汗。。。这个题目突然冒出来,挺不合适的吧。反正给我的感觉是太大了。
+ _+ d+ {, \6 j+ S' @. x! ]注,贴吧特征:# }3 |" s1 A7 u  A: B  L$ I
1、 老帖子一旦回复了,就跑到顶上了。玩bbs的同学都了解。5 z( ?. h5 R4 U( k; }7 `) ~+ n
2、偶尔存在暴吧行为,如何抗住这种压力(这里指存储压力),如何保证这种帖子还能被正常阅读
0 T$ s7 E5 Z6 w2 R1 E2 b: W$ {/ w* \3、很多用户只看贴吧头几页的帖子,所有针对这个特点应该可以做一些优化(Cache)。
+ `" c2 H+ K/ B( H" D7 [( v( r% jOK,设计吧。。。反正这个题目把我搞得很不爽。我猜,他是揣着答案了,总希望我说的跟贴吧的设计相似:(4 D% T4 w, l' S. x! H5 W$ b
: n& c  Z6 p, i2 B  q! h) P
面完大概五点,说下周等消息。他直接撤了,一人在那,哈哈,正好可以乘机溜达一下百度。先电话我偶像,用她门卡到处溜了一圈,然后去百度健身房跑了半个小时的步,到了饭点,直接去百度地下食堂吃了顿饭,还凑合。OVER。
5 U! L& m: f( G, \0 \: A& ?" r
& ^; W, M# p8 E& _5 |总结下,算法我有点卡,因为没有任何准备。我总觉得他们问的问题,《编程之美》上都涉及到了,并且比他们问的还深。所以,我决定开始好好看看《编程之美》了。 另外,他们都重复地问,能来实习么。不能
, Y: ^% M" J$ N3 K# z! q
& L8 A$ N. ?1 p4 P
) c' ?; X3 `' [0 a9 T3 l0 H: t  G* q" M$ J) |
文章摘自2012阿凡提求职手册——IT行业篇 8 `0 ~5 e* A/ l& H
http://bbs.aftjob.com/thread-607158-1-1.html
1 ^* ^" Y9 j/ f* V$ M) P) I——( e! o. U3 J: c
阿凡提百度(Baidu)求职俱乐部
9 a' W1 K# z/ m. j2 lhttp://bbs.aftjob.com/group-4-1.html
) d: C; M6 |' _0 R3 r) A5 m——
4 V+ G6 k! ]- \1 B关于Web前端及百度web前端笔试面试题目
9 z3 C6 c  p# ]7 yhttp://bbs.aftjob.com/thread-31614-1-1.html
, Q9 \& \( ~( _: e0 A9 {  q百度质量部测试一面面经
# `/ W; C2 t0 hhttp://bbs.aftjob.com/forum-viewthread-tid-31594-fromuid-35176.html3 g/ }: B- U) c7 C
百度面经篇
6 y7 L0 W6 T9 _) O5 Rhttp://bbs.aftjob.com/forum-viewthread-tid-469368-fromuid-35176.html, d- K6 K( F0 X; W( A! ]( S. W
——5 G8 z4 B5 K# Y) G* s
阿凡提(aftjob.com)求职社区
1 y! y1 L6 ]" j$ L! g+ f阿凡提求职俱乐部-国内第一家网络求职俱乐部,提供企业求职俱乐部和高校求职俱乐部交流平台。
% k$ N6 I( t& ]4 k- C——
您需要登录后才可以回帖 登录 | 加入后院

本版积分规则

Archiver|手机版|小黑屋|广告业务Q|工大后院 ( 粤ICP备10013660号 )

GMT+8, 2026-4-3 22:32

Powered by Discuz! X5.0

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表