April Breeze is blowing...

알바-_-로 크롤링 작업을 하고 있는데 이상하게 몇몇 페이지만 내용을 긁어오지 못하길래 확인을 해보니
내용이 많이 긴 페이지에서만 그런 현상이 있었다.

그래서 찾아보니,
pcre.backtrack_limit 라는 설정이 있고, 이 값을 늘려야 길이가 긴 문자열도 처리가 가능해지게 돼있었다.

다행히 ini_set 에서 변경가능해서 웹호스팅 계정에서도 적용가능하고,
작업할 페이지에만 일시적으로 적용도 가능하다.

Default value는 100000(100KB) 이고, 0 하나만 더 붙여도 왠만한 페이지 작업하는데 무리는 없을듯.

아래 링크는 구글링해서 찾은 페이지.
http://www.kavoir.com/2009/12/php-regular-expression-matching-input-subject-string-length-limit.html





...그런데, 알바 하던건 strpos, substr 등으로 처리해서 해결해버렸음-_-...




2010/03/27 11:32 2010/03/27 11:32
2010/03/27 11:32
Category dev.

TRACKBACK :: http://aprilbriz.com/trackback/113

  1. 빈치 2010/04/06 21:44 # M/D Reply

    하요!!! 위엣말은 도대체 무슨말??..
    잘지내시죵??
    오랫만에 작세 놀러가니까 몇몇분들 결혼도하셨던데..
    알프님은 좋은 소식 없으신가요?? 'ㅁ'??

    1. AprilBriz 2010/04/15 00:44 # M/D

      방명록 놔두고 여기다 안부를-_-ㅋ
      머 걍 적당히 지내고는 있음...
      좋은 소식은... 개뿔-_-

Leave a Comment
[로그인][오픈아이디란?]
1  ... 10 11 12 13 14 15 16 17 18  ... 109 
전체 (109)
calm (48)
passion (3)
Bicycle (30)
music (7)
dev. (12)
misc. (9)
Today 55 / Yesterday 67
Total 40556