브라우저 동작 원리

기술노트

브라우저 동작 원리

브라우저 주소창에 https://google.com 등 다양한 URL을 입력하여 해당 웹 페이지에 접속한 경험이 있을 것입니다. 어떠한 동작 원리로 우리가 입력한 페이지로 접속이 가능한지 알아보겠습니다.

브라우저란?

웹 브라우저는 동기(Synchronous)적으로 HTML, CSS, Javascript를 해석하여 내용을 화면에 보여주는 응용 소프트웨어입니다.

웹 브라우저가 웹 서버에 필요한 자원(웹 페이지)을 요청하면 서버는 응답하고 웹 브라우저는 이를 해석한 후 클라이언트에게 보여줍니다. 여기서 자원은 보통 HTML 문서지만 PDF, 이미지 등 다양한 형태일 수도 있습니다.

브라우저의 기본 구조

브라우저는 다음과 같은 주요 구성 요소로 이루어져 있습니다:

1. 사용자 인터페이스

사용자가 접근할 수 있는 영역입니다. 주소 표시줄, 이전/다음 버튼, 북마크, 새로고침 등 요청한 페이지를 보여주는 창을 제외한 모든 부분이 해당됩니다.

2. 브라우저 엔진

사용자 인터페이스와 렌더링 엔진 사이의 동작을 제어합니다. Data Storage를 참조하며 로컬에 데이터를 쓰고 읽으면서 다양한 작업을 수행합니다.

3. 렌더링 엔진

웹 서버로부터 응답 받은 자원을 웹 브라우저 화면에 표시해주는 역할을 합니다.

4. 통신

HTTP 요청과 같이 서버와 통신하게 하는 네트워크 호출에 사용됩니다.

5. UI 백엔드

select, input 등 기본적인 위젯을 그리는 인터페이스입니다.

6. 자바스크립트 해석기

자바스크립트 코드를 해석하고 실행합니다.

7. 자료 저장소

Cookie, Local Storage, Indexed DB 등 브라우저 메모리를 활용해 저장하는 영역입니다.

렌더링 엔진 동작 과정

렌더링 엔진은 서버로부터 응답받은 HTML 문서를 얻는 것으로 시작합니다.

1. 렌더링 엔진의 기본적인 동작 과정

1. 렌더링 엔진은 HTML 문서를 파싱해 DOM(Document Object Model) 트리를 구축합니다. 2. 외부 CSS 파일과 함께 포함된 스타일 요소를 파싱합니다. 3. DOM 트리와 2번의 결과물을 합쳐 렌더 트리를 구축합니다. 4. 렌더 트리 각 노드에 대해 화면 상에서 배치할 곳을 결정합니다. 5. UI 백엔드에서 렌더 트리의 각 노드를 그립니다.

2. 웹킷 엔진의 동작 과정

순서는 위의 기본 동작 과정과 유사합니다.

HTML 문서를 파싱해 DOM 트리를 구축

브라우저는 서버로부터 HTML 문서를 전달받고 HTML 파서를 통해 파싱하고 파싱트리를 생성합니다. 이를 기반으로 DOM 트리를 생성합니다.

예를 들어, 아래와 같은 HTML 코드는:

<html>
  <body>
   <p>Hello World</p>
   <div><img src="example.png" /></div>
  </body>
</html>

DOM 트리로 변환됩니다.

CSSOM 생성

CSS 파일은 스타일 시트 객체로 파싱되고 각 객체는 CSS 규칙을 포함합니다. CSS 규칙 객체(CSSOM)는 선택자와 선언 객체 그리고 CSS 문법과 일치하는 다른 객체를 포함합니다.

렌더 트리 생성

DOM 트리가 구축되는 동안 브라우저는 DOM 트리를 기반으로 렌더 트리를 생성합니다. 렌더 트리는 문서를 시각적인 구성 요소로 만들어주는 역할입니다.

웹킷은 이 구성 요소를 렌더러(renderer) 또는 렌더 객체(render object)라는 용어를 사용합니다. 렌더러는 자신과 자식 요소를 어떻게 배치하고 그려내야 하는지 알고 있습니다.

렌더러는 DOM 요소와 1:1로 대응하는 관계는 아닙니다. 그 이유는 <head>, display: 'none'과 같은 사용자가 볼 수 없는 DOM 요소는 렌더 트리에 추가되지 않기 때문입니다.

렌더 트리 배치(레이아웃)

렌더 트리를 생성했으면 렌더 트리를 배치합니다. 어느 공간에 위치해야 할지 각각 객체들에게 위치와 크기를 결정합니다.

렌더 트리 그리기

렌더 트리를 배치(레이아웃 구성)했으면 렌더 트리를 그립니다. 이때 UI 백엔드가 동작해서 화면에 렌더링합니다.

자바스크립트 처리 과정

HTML 파서는 <script> 태그를 만나면 자바스크립트 코드를 실행하기 위해서 DOM 생성 프로세스를 중지하고 자바스크립트 엔진으로 권한을 넘깁니다.

자바스크립트 엔진은 <script> 태그 내의 코드를 로드하고 파싱하여 실행합니다. 자바스크립트의 실행이 완료되면 다시 HTML 파서로 제어 권한을 넘겨 중지했던 시점으로 돌아가 DOM 생성을 재개합니다.

이처럼 브라우저는 동기적으로 HTML, CSS, Javascript를 처리합니다. 하지만 자바스크립트 엔진에 제어 권한이 있을 때 Javascript 코드가 완성되지 않은 DOM을 조작하게 된다면 에러가 발생할 수 있습니다.

이것이 HTML 파일에서 Javascript 코드를 <body> 태그 하단에 위치시키는 이유입니다.

관련 항목