반응형
HTTP 헤더 개요
- header-field = field-name ":" OWS field-value
- OWS(optional whitespace) (OWS:띄어쓰기 허용)
- field-name은 대소문자 구문 없음
- HTTP 헤더의 용도
- HTTP 전송에 필요한 모든 부가정보를 담는다.
- 예) 메시지 바디의 내용, 메시지 바디의 크기, 압축, 인증, 요청 클라이언트, 서버 정보, 캐시 관리 정보 등
- 표준 헤더가 너무 많음
- https://en.wikipedia.org/wiki/List_of_HTTP_header_fields
- 필요시 임의의 헤더 추가 가능
- helloworld: hihi
- HTTP 헤더의 분류 - RFC2616(과거)
- General 헤더
- 요청메시지, 응답메시지 구분없이 전체에 적용되는 정보
- 예)
Connection: close
- Request 헤더
- 요청 정보(요청메시지)
- 예)
User-Agent: Mozilla/5.0 (Macintosh; ..)
- Response 헤더
- 응답 정보(응답메시지)
- 예)
Server: Apache
- Entity 헤더
- 엔티티 바디 정보
- 예)
Content-Type: text/html, Content-Length: 3423
- HTTP BODY(message body) - RFC2616(과거)
- 메시지 본문(message body)은 엔티티 본문(entity body)을 전달하는데 사용
- 메시지 본문 안에 엔티티 본문을 담아서 전송한다.
- 엔티티 본문은 요청이나 응답에서 전달할 실제 데이터
- 엔티티 헤더는 엔티티 본문의 데이터를 해석할 수 있는 정보 제공
- 데이터 유형(html, json), 데이터 길이, 압축 정보 등등
- 데이터 유형(html, json), 데이터 길이, 압축 정보 등등
- 메시지 본문(message body)은 엔티티 본문(entity body)을 전달하는데 사용
- General 헤더
HTTP 표준 변화
1999년 RFC2616 - 폐기
- 2014년 RFC7230~7235 등장
- RFC723x 변화
- 엔티티(Entity) -> 표현(Representation)으로 분류 방식 변경
- 표현(Representation) = 표현 메타데이터(Representation Metadata) + 표현 데이터(Representation Data)
- 예) 리소스(회원 데이터)를 HTML, XML, JSON 등과 같이 여러가지 형태(표현)로 전달할 수 있다. 이러한 점 때문에 표현이라는 용어를 사용한다.
- HTTP BODY(message body) - RFC7230(최신)
- 메시지 본문(message body)을 통해 표현 데이터 전달
- 메시지 본문을 페이로드(payload)라고 한다.
- 표현은 요청이나 응답에서 전달할 실제 데이터(표현 헤더 + 표현 데이터)
- 표현 헤더는 표현 데이터를 해석할 수 있는 정보 제공
- 데이터 유형(html, json), 데이터 길이, 압축 정보 등 HTTP Body 부분을 설명
- 참고: 표현 헤더는 표현 메타데이터와, 페이로드 메시지를 구분해야 하지만, 여기서는 생략
표현(Representation)
- 표현 헤더는 요청, 응답 둘다 사용할 수 있다.
Content-Type
- 표현 데이터의 형식 설명
- 형식: 미디어 타입, 문자 인코딩
- 예)
text/html; charset=utf-8
application/json
- 기본 인코딩은 utf-8 이다.
image/png
Content-Encoding
- 표현 데이터 인코딩
- 표현 데이터를 압축하기 위해 사용
- 데이터를 전달하는 곳에서 압축 후 인코딩 헤더 추가
- 데이터를 읽는 쪽에서 인코딩 헤더의 정보로 압축 해제
- 예)
gzip
deflate
identity
(압축을 하지않는다는 의미)
Content-Language
- 표현 데이터의 자연 언어를 표현한다.
- 예) 표현 데이터가 한국어인지 영어인지에 대한 정보를 알려준다.
ko
en
en-US
Content-Length
- 표현 데이터의 길이에 대한 정보를 가진다.
- 바이트 단위
- 데이터 길이 자체는 표현과 무관하기 때문에 표현 헤더라기보다는 페이로드 헤더라고 구분할 수 있다.
- Transfer-Encoding(전송 코딩)을 사용하면 Content-Length를 사용하면 안된다.
- Transfer-Encoding안에 정보들이 다 포함되어 있다.
협상(Content negotiation)
- 클라이언트가 선호하는 표현 요청
- 서버는 클라이언트가 원하는 응답을 못 줄 수도 있지만 최대한 클라이언트 요청에 맞추어 응답한다.
- 협상 헤더는 요청시에만 사용할 수 있다.
- 협상과 우선순위
- Quality Values(q) 값 사용
- 범위: 0~1
- 클수록 높은 우선순위를 가진다.
- Quality Values(q) 값을 생략하면 가장 높은 우선순위인 1로 설정된다.
- 예)
Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7
- 1.
ko-KR;q=1
(q생략)
- 2.
ko;q=0.9
- 3.
en-US;q=0.8
- 4.
en:q=0.7
- 1.
- 더 구체적인 것일수록 높은 우선순위를 가진다.
- 예)
Accept: text/*, text/plain, text/plain;format=flowed, */*
- 1.
text/plain;format=flowed
- 2.
text/plain
- 3.
text/*
- 4.
*/*
- 1.
- 예)
- 구체적인 것을 기준으로 미디어 타입을 맞춘다.
- 예)
Accept: text/*;q=0.3, text/html;q=0.7, text/html;level=1, text/html;level=2;q=0.4, */*;q=0.5
text/plain
,image/jpeg
와 정확히 일치하는 것이 없지만 구체적으로 작성된 미디어 타입을 보고 우선순위를 설정한다.- 예)
text/*
이text/plain
,*/*
은image/jpeg
으로 설정.
- 예)
- 예)
Accept
- 클라이언트가 선호하는 미디어 타입 전달
Accept-Charset
- 클라이언트가 선호하는 문자 인코딩
Accept-Encoding
- 클라이언트가 선호하는 압축 인코딩
Accept-Language
- 클라이언트가 선호하는 자연 언어
Accept-Language
적용 전
Accept-Language
적용 후
Accept-Language
복잡한 예시- 서버에서 한국어 응답이 불가능할 때 독일어보다는 영어로 보고싶다면 우선순위를 설정해서 요청한다.
전송 방식
- 단순 전송
- 콘텐츠에 대한 길이를 알 수 있을 때 사용한다. (
Content-Length
를 지정한다.)
- 한 번에 요청하고 한 번에 콘텐츠를 전달받는다.
- 콘텐츠에 대한 길이를 알 수 있을 때 사용한다. (
- 압축 전송
- 전달하는 응답 데이터를 서버에서 압축해서 전달한다.
- 서버에서 무엇으로 압축하였는지에 대한 정보를 클라이언트에 전달한다.
Content-Encoding
- 해당 압축 정보를 알아야 클라이언트에서 받고 해석할 수 있다.
- 분할 전송
- Transfer-Encoding
chunked
: 덩어리를 쪼개서 보낸다.
- 서버에서 클라이언트로 5바이트를 먼저 보낸다. Hello
- 서버에서 클라이언트로 5바이트를 먼저 보낸다. World
- 끝난 경우 0이라고 표시하고
\r\n
을 클라이언트에 전달
- 한 번에 보낼 경우 좀 기다려야 하지만 분할해서 보낸다면 오는대로 바로바로 표시할 수 있다.
- 분할 전송은
Content-Length
를 설정하면 안된다.Content-Length
를 예상할 수 없다.
chunked
각각이 바이트 정보들을 가지고 있다.
- Transfer-Encoding
- 범위 전송
- 범위 전송의
Content-Length
는 실제 전송된 데이터의 길이로 설정하면 된다.
- Range
- 클라이언트에서 요청
Range: bytes=1001-2000
bytes=1001-2000
- Content-Range
- 서버에서 응답
Content-Range: bytes 1001-2000 / 2000
bytes 1001-2000
요청 범위
/2000
끝 길이
- 예) 이미지를 받는데 절반정도 받은 상태에서 끊기면 다시 요청해야한다.
- 처음부터 다시 요청하는 것은 용량이 아깝다. 범위 전송 같은 경우에는 범위를 지정해서 요청할 수 있다.(이미 절반 받았으니 나머지 절반을 보내달라고 요청)
- 범위 전송의
일반 정보
- From
- 유저 에이전트의 이메일 정보
- 일반적으로 잘 사용되지 않음
- 검색 엔진 같은 곳에서, 주로 사용
- 검색엔진 담당자와 연락할 수 있는 방법이 필요
- 요청에서 사용
- Referer
- 현재 요청된 페이지의 이전 웹 페이지 주소
- A -> B로 이동하는 경우 B를 요청할 때 Referer: A 를 포함해서 요청
- Referer를 사용해서 유입 경로 분석 가능
- 요청에서 사용
- 참고: referer는 단어 referrer의 오타
- 오타를 수정하면 기존 서버의 파싱 문제 발생으로 때문에 오타 그대로 유지 결정
- User-Agent
- 클리이언트의 애플리케이션(== 유저 에이전트) 정보(웹 브라우저 정보, 등등)
user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/ 537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36
- 통계 정보를 뽑는데 유용
- 어떤 종류의 브라우저에서 장애가 발생하는지 파악 가능
- 요청에서 사용
- Server
- 요청을 처리하는 ORIGIN 서버의 소프트웨어 정보
- ORIGIN 서버
- HTTP 요청을 보내면 여러 프록시 서버를 거치게 된다.
- 실제로 나의 요청이 도착해서 나에게 HTTP 응답을 해주는 마지막에 위치한 서버를 ORIGIN 서버라고 한다.
Server: Apache/2.2.22 (Debian)
server: nginx
- 응답에서 사용
- Date
- 메시지가 생성된 날짜와 시간
Date: Tue, 15 Nov 1994 08:12:31 GMT
- 응답에서 사용
- 과거 스펙에서는 요청에도 사용이 가능했으나 최신 스펙에서는 응답만 사용으로 변경
특별한 정보
- Host
GET /search?q=hello&hl=ko HTTP/1.1 Host: www.google.com
- 요청한 호스트 정보(도메인)
- 요청에서 사용
- 필수 값으로 반드시 설정되어야 한다.
- 예) 하나의 서버가 여러 도메인을 처리해야 할 때
- 가상호스트를 통해 여러 도메인을 한번에 처리할 수 있는 서버. 실제 애플리케이션이 여러개 구동될 수 있다.
- Host가 없다면 서버 입장에서는
/hello
요청을 어떤 도메인(aaa.com, bbb.com, ccc.com)에 해야하는지 알 수 없다.(IP로만 통신) - Host 헤더를 넣음으로써 서버에서는 Host 값을 참고하여 해당 도메인에
/hello
요청을 전달할 수 있다.
- 예) 하나의 IP 주소에 여러 도메인이 적용되어 있을 때
- Location
- 페이지 리다이렉션
- 웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 자동 이동 (리다이렉트)
- 응답코드 3xx에서 설명
- 201 (Created): Location 값은 요청에 의해 생성된 리소스 URI
- 3xx (Redirection): Location 값은 요청을 자동으로 리디렉션하기 위한 대상 리소스를 가리킴
- Allow
- 허용 가능한 HTTP 메서드
- 405 (Method Not Allowed) 에서 응답에 포함해야한다.
- URL 경로는 있는데 요청 메서드를 지원하지 않는 경우 발생
Allow: GET, HEAD, PUT
- 서버에서 많이 구현되어있지는 않다. 이런것이 있다라고 알고 넘어가자
- Retry-After
- 유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간
- 503 (Service Unavailable): 서비스가 언제까지 불능인지 알려줄 수 있음
Retry-After: Fri, 31 Dec 1999 23:59:59 GMT
(날짜 표기)
Retry-After: 120
(초단위 표기)
인증
- Authorization
- 클라이언트 인증 정보를 서버에 전달
Authorization: Basic xxxxxxxxxxxxxxxx
- 인증과 관련되서 여러가지 매커니즘이 존재한다.(OAuth, ...)
- 인증 방식에 따라 값으로 들어가는 형식은 달라질 수 있다.
- WWW-Authenticate
- 리소스 접근시 필요한 인증 방법 정의
- 401 Unauthorized 응답과 함께 사용
WWW-Authenticate: Newauth realm="apps", type=1, title="Login to \"apps\"", Basic realm="simple"
쿠키
- 서버에서 보내준 쿠키는 웹 브라우저 내부의 쿠키 저장소에 저장된다.
- 예) set-cookie: sessionId=abcde1234; expires=Sat, 26-Dec-2020 00:00:00 GMT; path=/; domain=.google.com; Secure
- Set-Cookie
- 응답 메시지
- 서버에서 클라이언트로 쿠키 전달
- Cookie
- 요청 메시지
- 클라이언트가 서버에서 받은 쿠키를 저장하고, HTTP 요청시 서버로 전달
- 예) 로그인 - 쿠키 미사용
- 처음 welcome 페이지 접근
- 로그인
- 로그인 이후 welcome 페이지 접근 (이전에 로그인 했어도 알 수 있는 방법이 없다.)
- HTTP는 무상태(Stateless) 프로토콜이다.
- 쿠키 미사용 대안 - 모든 요청에 사용자 정보 포함
- 모든 요청에 정보를 넘기는 문제
- 모든 요청에 사용자 정보가 포함되도록 개발 해야함
GET /welcome?user=홍길동 HTTP/1.1
GET /board?user=홍길동 HTTP/1.1
GET /order?user=홍길동 HTTP/1.1
GET /xxx...?user=홍길동 HTTP/1.1
- 브라우저를 완전히 종료하고 다시 열면?
- 웹 스토리지에 저장해서 다시 값을 넘겨도 되지만 이렇게 개발하는 것은 힘들다.
- 모든 요청에 사용자 정보가 포함되도록 개발 해야함
- 예) 로그인 - 쿠키 사용
로그인 - 쿠키 미사용
에서 발생한 문제들을 해결할 수 있다.
- 로그인
- 로그인 이후 welcome 페이지 접근
- 모든 요청에 쿠키 정보 자동 포함
- 요청 할 때 마다 쿠키 저장소에서 쿠키를 조회한다.
- 쿠키 사용처
- 사용자 로그인 세션 관리
- 사용자 정보를 쿠키에 모두 담는 것이 아니라 서버에서 로그인을 성공하면 세션 키라는 것을 만들어서 DB에 저장해놓고 쿠키에 세션 키를 넣어서 클라이언트에 전달한다.
- 세션 키는 탈취당하면 큰일이기 때문에 네트워크 구간 암호화를 위해 HTTPS를 사용하고 추가로 세션 키가 탈취 당했더라도 탈취하는데 걸린 시간보다 세션이 더 적은 생존 기간을 가지고 있다면 안전할 수 있기 때문에 session의 생존 기간을 짧게 가져가는 것이 좋다.
- 광고 정보 트래킹
- 사용자 로그인 세션 관리
- 쿠키 정보는 항상 서버에 전송된다.
- 네트워크 트래픽 추가 유발
- 최소한의 정보만 사용하는 것이 좋다.(세션 id, 인증 토큰)
- 서버에 전송하지 않고, 웹 브라우저 내부에 데이터를 저장하고 싶으면 웹 스토리지 (localStorage, sessionStorage) 참고
- 쿠키와 유사하게 사용할 수 있다. 그러나 서버에 전송하지않고 클라이언트에서 보관하며 클라이언트 로직(자바스크립트)에서 필요할 때마다 꺼내서 사용할 수 있다.
- 네트워크 트래픽을 감소시킬 수 있다.
- 네트워크 트래픽 추가 유발
- 쿠키, 웹 스토리지 사용 주의점
- 보안에 민감한 데이터는 저장하면 안됨(주민번호, 신용카드 번호 등등)
- 쿠키 - 생명주기(expires, max-age)
- expires
- 만료일이 되면 쿠키 삭제
- 예) Set-Cookie: expires=Sat, 26-Dec-2020 04:39:21 GMT
- max-age
- 0이나 음수를 지정하면 쿠키 삭제
- 예) Set-Cookie: max-age=3600 (3600초)
- 쿠키 종류
- 세션 쿠키
- 만료 날짜를 생략하면 브라우저 종료시 까지만 유지
- 예) 로그인 후, 브라우저 완전히 종료 후 다시 접속하면 로그인 필요
- 영속 쿠키
- 만료 날짜를 입력하면 해당 날짜까지 유지
- 세션 쿠키
- expires
- 쿠키 - 도메인(Domain)
- 내가 지정한 쿠키가 아무 사이트나 들어가도 서버에 전달되는 것은 문제. 쿠키를 전달할 도메인을 설정할 때 사용한다.
- 명시: 명시한 문서 기준 도메인 + 서브 도메인 포함
- 예)
domain=example.org
를 지정해서 쿠키 생성- example.org는 물론이고
- dev.example.org도 쿠키 저장소 접근
- 예)
- 생략: 현재 문서 기준 도메인만 적용
- 예) example.org 에서 쿠키를 생성하고 domain 지정을 생략
- example.org 에서만 쿠키 저장소 접근
- dev.example.org는 쿠키 저장소 미접근
- 예) example.org 에서 쿠키를 생성하고 domain 지정을 생략
- 쿠키 - 경로(Path)
- 이 경로를 포함한 하위 경로 페이지만 쿠키 접근
- 예)
path=/home
지정/home
-> 쿠키 전달 가능
/home/level1
-> 쿠키 전달 가능
/home/level1/level2
-> 쿠키 전달 가능
/hello
-> 쿠키 전달 불가능
- 예)
- 일반적으로
path=/
루트로 지정- 한 도메인 안에서는 보통 쿠키를 모두 전송하기를 원하기 때문
- 이 경로를 포함한 하위 경로 페이지만 쿠키 접근
- 쿠키 - 보안(Secure, HttpOnly, SameSite)
- Secure
- 쿠키는 http, https를 구분하지 않고 전송
- Secure를 적용하면 https인 경우에만 클라이언트에서 서버로 쿠키 전송
- HttpOnly
- XSS 공격 방지
- 원래 자바스크립트에서 쿠키에 접근 가능할 수 있다.
HttpOnly
사용 시 자바스크립트에서 접근 불가 (document.cookie)- 로컬 PC에 저장된 쿠키를 조회하는 기능을 막는다.
- HTTP 전송에만 사용
- SameSite
- XSRF 공격 방지
- 요청 도메인과 쿠키에 설정된 도메인이 같은 경우만 쿠키 전송
- 요청 도메인과 쿠키에 설정된 도메인이 달라도 다른사이트에서 쿠키 셋팅해서 전송할 수 있는 것을 방지
- Secure
[참고자료]
반응형
'HTTP > 기본' 카테고리의 다른 글
[모든 개발자를 위한 HTTP 웹 기본 지식] HTTP 헤더 - 2(캐시와 조건부 요청) (0) | 2021.07.18 |
---|---|
[모든 개발자를 위한 HTTP 웹 기본 지식] HTTP 상태코드 (0) | 2021.07.15 |
[모든 개발자를 위한 HTTP 웹 기본 지식] HTTP 메서드 활용 - HTTP API 설계 (0) | 2021.07.15 |
[모든 개발자를 위한 HTTP 웹 기본 지식] HTTP 메서드 활용 - 클라이언트에서 서버로 데이터 전송 (0) | 2021.07.13 |
[모든 개발자를 위한 HTTP 웹 기본 지식] HTTP 메서드 (0) | 2021.07.12 |