|
|
08.13 – 百度日文图搜1,2面 - 余总+ D4 I! w* I, h# `0 @5 ^# k
5 T) Z8 ~$ B+ E' D# f0 K
, K3 L- z [' w E) W
8 C& ^9 @ y4 t# z" p在朋友的帮助下,今天面百度 一共面了两面,第一个人面完,喊出另外一个工程师接着面。
, y9 q) l( U/ ?6 w0 A7 ^+ X1 d面试三点开始。我去得比较早,就在大厅里面等了个把钟头,环境看上去不错。哈哈。具体后面说。
2 Q' `& t% Q }3 E: [8 F( o
3 v+ k% u1 |, D8 V9 r第一面
2 V6 ?/ |& n' Q一个哥哥,挺kind的。聊天知道貌似是浙大ACM的,而且还跟我们大组的一个博士gg是好朋友。8 `8 k; _7 M* W z" a1 S
首先,自我介绍,稍微说了下。这里我觉得是每个人唯一可以准备得最好的了。说条理点,给人家一个立体印象会很好。然后就要“例行公事了”,开搞:1 }5 [+ M7 W8 p2 ~3 J
第一题,据说中的经典算法,数组a[len],找出其中最大的三个数。写程序,写个意思就行。
! x6 z: P$ N3 { z9 O第二题 ,貌似搞算法的人都知道,应该也是据说中的经典题。有一个单向链表。对于单链表,链表尾部是NULL。突然有一天,某人没事把尾部的指针指向了链表中间的某个元素,这样就形成了一个网球拍状的链表,一个柄,然后前面一个圈。
) h& W9 Z, l& [# e; |4 s" z2 r 问题1:如何遍历链表(可以重复访问)(hint:简单next访问的话,会死循环在圈里的哦,所以得想点办法)) J* w9 f1 I# I# A" T, ]; w
问题2:如何确定柄和圈相接位置的元素是哪个?
; E" v3 B: ], Q4 M第三题,开放题,关于图片搜索。9 S/ u9 S' @: f% j8 ]0 a
一个页面,例如http://esfang.house.sina.com.cn/n_news/news_show.php?id=20439这个link里面,有个图片。图片搜索的基本思想是候根据页面正文的内容来推测图片内容。这个页面中,除了正文上有文字,顶上、边上都有链接和广告,是与图片不相关的内容,需要过滤掉。如何过滤这些五官内容,提取正文? 请说出你的思路。方法可以不拘一格,可以多种方法并用。我扯出了六七种,应该都还蛮靠谱。2 b1 Z, o2 h0 ~0 }4 w- S
' c. `1 Z- l6 L( F+ S$ y
OK,就这么多面试问题。我看了下表,刚好一个小时。这个gg喊了另外一个gg来接着面。
5 a% i1 H" P9 L
' _% J' T6 o8 c* F, P8 l8 ?& ^- {二面开始
. O- d4 N- @4 a0 @2 V& h- j还是先自我介绍,让随便讲讲。很快进入主题,开始做题:
6 m0 x3 X3 E- A4 N* I% M第一题 : 100万行ip地址区间,已排序。给出一个ip地址,从100万行中找出该ip地址所属行。如果找不到,输出找不到即可。
, Z6 Z- ?" \3 W! N1 I, R' Z6 F6 R已知,区间首尾两个ip的前三节的ip地址相等,只有最后一节不同。
9 o, m% C4 t- R& g+ ^+ G例如:- C! \( \7 Z5 f! T- h
127.0.0.3 ~ 127.0.0.6, ?% L5 M. @) t
127.0.0.16 ~ 127.0.0.49
8 } r( m' Z: |4 P) @4 L* g6 N- ].....
+ M( z+ g6 N3 A: F210.2.0.16 ~ 210.2.0.233
0 a6 L+ R# Q$ w3 H% {.....: c9 d; N: `: V3 Y! u
上面每个区间前三节都等。
( q8 @4 ?: {6 H, y/ b) U210.2.0.16 ~ 210.4.0.233这样的区间不合法,不回出现在给出的* U* G- t1 n/ F1 q8 E) e# `2 r
数据中。
5 z% ^+ ~$ |4 Q3 g" P给出输入127.0.0.18,输出为127.0.0.16 ~ 127.0.0.49。
' ]' N& f- Y" Y$ C h1 X, G+ N$ r D0 \) W O$ w
这个题目补充一句,最容易想到的算法就是二分查找了。可行。面试的人非得让我想出个更快的方法。没想出来,到最后结束的时候问了下他答案,也就是加快查找那些事,恩,你知道的。 * {- v/ U) _3 |5 M$ |& z
. [: Z% N5 ]; M( g$ p4 H
第二题 ,你知道Cache替换算法有哪些嘛?你学过吗?" p4 F3 ?3 }/ J8 C: u; G0 l# @
恩,我当然学过。blablabla
. d$ A/ v$ ]( e7 F3 U9 m( \* ]那么你能实现一个LRU Cache算法吗?
u5 q$ d. h% b4 y我走偏了。。。。。直接以为要实现一个硬件Cache LRU替换算法。。。太失误了。。。他一个搞软件的,关心硬件Cache干吗。。。! M8 l! a) h4 p' |: U# i6 e0 Y
OK,软件LRU算法如何实现大家肯定都知道。
" G( T" t1 E% x4 d- s* A0 v这个题目是他一个引子,后面开始才是重点。题目大意,百度贴吧这么多帖子,动不动还有“贾君鹏你妈喊你回家吃饭”的爆吧行为。如何设计一套存储系统以满足贴吧的需求。设计包括Cache、磁盘文件数据块的布局、结构、安排等等。总之,设计一个存储系统!我真有点汗。。。这个题目突然冒出来,挺不合适的吧。反正给我的感觉是太大了。
) Y! M u% c" X$ ^注,贴吧特征:
8 y( F; x: Y2 W: R1、 老帖子一旦回复了,就跑到顶上了。玩bbs的同学都了解。
. u/ r% P) a! ~0 O6 P% ], d) M2、偶尔存在暴吧行为,如何抗住这种压力(这里指存储压力),如何保证这种帖子还能被正常阅读
- { k6 A( ~0 h) g% d8 b3、很多用户只看贴吧头几页的帖子,所有针对这个特点应该可以做一些优化(Cache)。
7 p5 w: M; s4 Y7 `; T& X8 @2 LOK,设计吧。。。反正这个题目把我搞得很不爽。我猜,他是揣着答案了,总希望我说的跟贴吧的设计相似:(4 n4 H$ Z/ o9 u9 F; D3 y2 e
3 d w* u- T' R/ _/ [
面完大概五点,说下周等消息。他直接撤了,一人在那,哈哈,正好可以乘机溜达一下百度。先电话我偶像,用她门卡到处溜了一圈,然后去百度健身房跑了半个小时的步,到了饭点,直接去百度地下食堂吃了顿饭,还凑合。OVER。
" ? |: j2 _3 W5 c; u1 M9 ^
3 z+ L0 Z( x1 U, l总结下,算法我有点卡,因为没有任何准备。我总觉得他们问的问题,《编程之美》上都涉及到了,并且比他们问的还深。所以,我决定开始好好看看《编程之美》了。 另外,他们都重复地问,能来实习么。不能
) g6 E2 M" c+ C% F$ X* s# C+ j' C9 A; O; U! `1 l6 p3 w1 O0 u
! s4 }) I8 u. g4 a2 A
; D) `- G1 a* E% J& F8 l文章摘自2012阿凡提求职手册——IT行业篇
$ B0 s- V5 z6 t, }0 }; s8 Shttp://bbs.aftjob.com/thread-607158-1-1.html
& X- D2 J( E* }5 H9 X——
! G! j1 a& m1 @0 ~) p阿凡提百度(Baidu)求职俱乐部
4 W0 y* \( s: p3 @" `http://bbs.aftjob.com/group-4-1.html! I" P# p& e8 B3 M8 [
——
" w' n3 N! f8 z关于Web前端及百度web前端笔试面试题目2 Z1 V6 L+ k1 d( A: E
http://bbs.aftjob.com/thread-31614-1-1.html0 S. L s; J% B2 Y$ N* z
百度质量部测试一面面经5 X7 v8 E# |) a+ X
http://bbs.aftjob.com/forum-viewthread-tid-31594-fromuid-35176.html
, M1 O' {' h: j# t( t$ @百度面经篇
' E/ L0 f" z( G, l+ e; N/ Ehttp://bbs.aftjob.com/forum-viewthread-tid-469368-fromuid-35176.html
" C3 t8 x7 F2 W7 R8 \# o——2 g' X! v6 r. V
阿凡提(aftjob.com)求职社区( v6 C$ q& i2 B& q, P& ?# [5 {
阿凡提求职俱乐部-国内第一家网络求职俱乐部,提供企业求职俱乐部和高校求职俱乐部交流平台。 Z. O! Y8 J4 t! c M& t
—— |
|