fabricawebs
Blog donde podrás encontrar el árticulo o tutorial que estas buscando sobre PHP, JavaScript, XML, Flash, Ruby on Rails, o desarrollo web en general.

Sopa fácil y barata con Python

Category: By Carlos
Llevo unos días leyendo el manual de Python y mira por donde hoy me ha surgido la oportunidad de usarlo en un caso real. Necesitaba extraer los textos de unas plantillas html y guardarlos en un fichero para posteriores operaciones. La solución que he encontrado es realmente simple, utilizando la librería Beautiful Soup de parseo de HTML/XML :

from BeautifulSoup import BeautifulSoup

import sys
if len(sys.argv) >= 2:
f = open(sys.argv[1])
freturn = open("striptag_result", "w")
soup = BeautifulSoup(f.read())
freturn.write( ''.join([e for e in soup.recursiveChildGenerator() if isinstance(e,unicode)]).encode('utf-8')
)
freturn.close()
else:
print "Uso: striptags.py fichero"
 

Crear un source en Sphinx

Category: By Carlos
Cuando el source es de tipo sql hay un elemento muy importante, el "Document ID", este se nombra en muchas partes de la documentación, y queda bastante claro que es el identificador único que utilizará Sphinx para distinguir las tuplas de datos, a base de ensayo y error averigüe que Sphinx toma como Document ID el primer campo que devuelves en la consulta sql, pero el caso es que me costó un buen rato encontrar en la documentación un parrafo donde explicara esto y lo definiera, por fin lo encontré y por eso lo quiero dejar por aqui:

"There can be only one main query. This is the query which is used to retrieve documents from SQL server. You can specify up to 32 full-text fields (formally, upto SPH_MAX_FIELDS from sphinx.h), and an arbitrary amount of attributes. All of the columns that are neither document ID (the first one) nor attributes will be full-text indexed.

Document ID MUST be the very first field, and it MUST BE UNIQUE UNSIGNED POSITIVE (NON-ZERO, NON-NEGATIVE) INTEGER NUMBER. It can be either 32-bit or 64-bit, depending on how you built Sphinx; by default it builds with 32-bit IDs support but --enable-id64 option to configure allows to build with 64-bit document and word IDs support. "

http://www.sphinxsearch.com/docs/current.html#conf-sql-query