알바-_-로 크롤링 작업을 하고 있는데 이상하게 몇몇 페이지만 내용을 긁어오지 못하길래 확인을 해보니
내용이 많이 긴 페이지에서만 그런 현상이 있었다.
그래서 찾아보니,
pcre.backtrack_limit 라는 설정이 있고, 이 값을 늘려야 길이가 긴 문자열도 처리가 가능해지게 돼있었다.
다행히 ini_set 에서 변경가능해서 웹호스팅 계정에서도 적용가능하고,
작업할 페이지에만 일시적으로 적용도 가능하다.
Default value는 100000(100KB) 이고, 0 하나만 더 붙여도 왠만한 페이지 작업하는데 무리는 없을듯.
아래 링크는 구글링해서 찾은 페이지.
http://www.kavoir.com/2009/12/php-regular-expression-matching-input-subject-string-length-limit.html
...그런데, 알바 하던건 strpos, substr 등으로 처리해서 해결해버렸음-_-...
내용이 많이 긴 페이지에서만 그런 현상이 있었다.
그래서 찾아보니,
pcre.backtrack_limit 라는 설정이 있고, 이 값을 늘려야 길이가 긴 문자열도 처리가 가능해지게 돼있었다.
다행히 ini_set 에서 변경가능해서 웹호스팅 계정에서도 적용가능하고,
작업할 페이지에만 일시적으로 적용도 가능하다.
Default value는 100000(100KB) 이고, 0 하나만 더 붙여도 왠만한 페이지 작업하는데 무리는 없을듯.
아래 링크는 구글링해서 찾은 페이지.
http://www.kavoir.com/2009/12/php-regular-expression-matching-input-subject-string-length-limit.html
...그런데, 알바 하던건 strpos, substr 등으로 처리해서 해결해버렸음-_-...
빈치 2010/04/06 21:44 # M/D Reply
하요!!! 위엣말은 도대체 무슨말??..
잘지내시죵??
오랫만에 작세 놀러가니까 몇몇분들 결혼도하셨던데..
알프님은 좋은 소식 없으신가요?? 'ㅁ'??
AprilBriz 2010/04/15 00:44 # M/D
방명록 놔두고 여기다 안부를-_-ㅋ
머 걍 적당히 지내고는 있음...
좋은 소식은... 개뿔-_-