전반적으로 바이두의 서로 다른 서버 갱신 시간이 일정하지 않아 생긴 것이다.
세밀한 분석을 통해 세 가지 문제를 확장할 수 있습니다.
1, 왜 바이두가 다른 서버를 가지고 있을까
A: Baidu 는 매일 많은 데이터를 수집합니다. 각 스냅 페이지는 몇 K 에서 몇 10K 까지 다양합니다. 이로 인해 하드 드라이브가 무한히 확대되고 어느 정도 하드 드라이브를 추가해야합니다. 어느 정도까지 서버를 추가하면 데이터가 많이 추가되며 서버를 바꾸지 않으면 속도가 느려질 것입니다.
2, 왜 키워드마다 스냅샷이 다른가요
A: 검색을 더 빠르고 빠르게 하기 위해 바이두 측은 같은 키워드의 데이터를 같은 서버에 배치하여 가장 빠른 검색 결과를 얻을 수 있습니다. 서버 업데이트 스냅샷 시간이 다르기 때문에 서버마다 스냅샷 시간이 다를 수 있습니다.
간단히' 청음' 으로 해석할 수 있는 키워드 데이터베이스는 A 서버에 두고,' 어이없는' 키워드 데이터베이스는 B 서버에 보관하고, A 의 서버는 업데이트되었고, B 의 서버는 아직 업데이트 차례가 되지 않았다. 그래서 키워드' 청음' 을 검색할 때 오늘의 스냅,' 어이가 없다' 를 검색할 때 바로 이전의 스냅 샷입니다.
3. 위와 같이 많은 홈페이지 스냅샷이 있어야 하는데, 왜 제 사이트: 사이트 주소일 때 홈페이지 스냅샷이 하나만 나오는데 최신인가요? (시드 비셔스, Northern Exposure (미국 site 드라마), 인터넷명언)
A: site 는 Baidu 검색의 고급 내부 명령입니다. 일단 정확한 site 명령이 나타나면 Baidu 검색 프로그램은 해당 사이트를 저장하는 모든 데이터를 호출하고 비교 분석을 거쳐 동일한 페이지를 버리고 해당 사이트의 모든 검색 페이지의 최신 스냅샷을 가져오므로 사이트 뒤의 사이트 스냅샷은 항상 최신이며 고유합니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), Northern Exposure (미국 TV 드라마), 검색명언)
사이트 후 바이두가 사이트 서버를 검색하는 모든 정보를 조회하고 호출해야 하기 때문에, 우리 사이트가 검색을 표시하는 페이지 수가 정확하지 않다. 보통 우리는 검색의 마지막 페이지까지, 또 {힌트: 가장 관련성이 높은 결과를 제공하기 위해, 우리는 내용이 비슷한 항목을 생략하고, 여기를 클릭하면 모든 검색 결과를 볼 수 있다. }, 우리가 다시 클릭했을 때, 그것은 정확한 모든 기록 데이터입니다.