Hört sich sehr interessant an. Ich werde euch ein Doku zusammenstellen, das genau umschreibt was der Crawler machen soll. Dann solltet ihr in der Lage sein, den Aufwand genau abzuschätzen.
Hardwaremässig kann ich das anbieten:
Processor Dual 2.4GHz Xeon Processors
RAM 1GB RAM*, Upgradeable to 4GB
Hard Drive 2 x 200GB HDDs
Drive Controller IDE RAID 1
Bandwidth 2000GB Bandwidth
Uplink Port 100Mbps
IP Addresses 29 IP Addresses*, Upgradeable to 61 IP Addresses
Operating System Choice of RedHat Enterprise Linux 3.0, RedHat Enterprise Linux 4.0*, Microsoft Windows Server 2003, Debian, FreeBSD, or CentOS
Control Panel Available cPanel, Helm, or Plesk
Web Analytics Available Urchin 5.0
Database Available MySQL, Shared or Dedicated Microsoft SQL Server 2000, Oracle 10G Standard Edition One
Falls mehr Ram nötig ist ... kein Problem.
Es ist allerdings nicht wichtig, dass das gesamte CH Netz innert eines Tages gecrawled ist. Eine Woche ist auch ok
Sollte ich aber auch mal DE oder UK crawlen wollen, sollte dies auch in einer anständigen Zeit möglich sein...
Wichtig ist auch noch: Das ist kein Projekt von TD, sonder von mir privat.